المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
أصدرت NVIDIA للتو ورقة قد تحل أكبر مقايضة في نماذج اللغة الكبيرة.
السرعة مقابل الجودة.
النماذج ذاتية الانحدار (مثل GPT) ذكية لكنها بطيئة - تولد رمزا واحدا في كل مرة، مما يترك معظم بطاقة الرسوميات في حالة خمول.
نماذج الانتشار سريعة لكنها غالبا ما تنتج مخرجات غير متماسكة.
TiDAR يمنحكما الاثنين في تمريرة أمامية واحدة.
إليكم الجزء العبقري:
وحدات معالجة الرسوميات الحديثة يمكنها معالجة رموز أكثر بكثير مما نستخدمه فعليا. يستغل TiDAR هذه "الفتحات المجانية" من خلال:
1. صياغة عدة رموز في نفس الوقت باستخدام الانتشار (مرحلة "التفكير")
2. التحقق منها باستخدام الانحدار الذاتي (مرحلة "الحديث")
كلاهما يحدث في نفس الوقت باستخدام أقنعة ذكية للانتباه - ثنائية الاتجاه للرسم، وسببية للتحقق.
النتائج:
↳ أسرع بمقدار 4.71 مرة عند 1.5 مليار معاملة مع صفر فقدان جودة
↳ أسرع بنحو 6 مرات عند 8B معلمات
↳ أول بنية تتفوق على فك الترميز الافتراضي (EAGLE-3)
↳ يعمل مع التخزين المؤقت KV القياسي، على عكس نماذج الانتشار النقي
خدعة التدريب ذكية أيضا - بدلا من إخفاء الرموز عشوائيا، يخفون كل شيء. هذا يعطي إشارات تعلم أقوى ويتيح الرسم السريع بخطوة واحدة فعالة.
إذا كنت تبني وكلاء الذكاء الاصطناعي في الوقت الحقيقي حيث يؤدي التأخير إلى تدمير التجربة، فإن هذه البنية تستحق الانتباه.
...

الأفضل
المُتصدِّرة
التطبيقات المفضلة

