DeepSeek أصدرت للتو ورقة رائعة لإنهاء عام 2025 "mHC: الاتصالات الفائقة المقيدة بمتشعب" تحول الاتصالات الفائقة الطريق السريع المتبقي في المحولات إلى n مسارات متوازية، وتتعلم كل طبقة كيفية تبديل ومشاركة الإشارات بين المسارات. لكن إذا كان بإمكان كل طبقة تضخيم أو تقليص المسارات بشكل عشوائي، فإن نتيجة تلك التغييرات عبر العمق تجعل الإشارات/التدرجات تتلاشى أو تتلاشى. لذا فهي تجبر كل خلط على الحفاظ على الكتلة: مصفوفة عشوائية مزدوجة (غير سالبة، كل صف/عمود يجمع 1). كل طبقة يمكنها فقط إعادة توزيع الإشارة عبر المسارات، وليس إنشائها أو تدميرها، لذا يبقى مسار التخطي العميق مستقرا بينما لا تزال الميزات تختلط! مع n=4 تضيف ~6.7٪ وقت تدريب، لكنها تقلل الخسارة النهائية بمقدار ~0.02، وتحافظ على المكاسب العكسية في أسوأ الحالات ~1.6 (مقابل ~3000 بدون القيد)، مع انتصارات معيارية ثابتة في جميع الجوانب