.@NVIDIA لقد حققت نجاحا مذهلا باستخدام نموذج 4B صغير تفوق على أنظمة أكبر بكثير على ARC AGI 2، بسعر 29.72٪ / 0.20 دولار لكل مهمة! من خلال الاعتماد على البيانات التركيبية والتدريب على وقت الاختبار بدلا من مقياس القوة الغاشمة، أثبت فريق NVARC أن التصميم الذكي يمكن أن يتفوق على عدد المعلمات الخام. إنها إشارة مثيرة إلى أن التفكير الفعال والتكيفي قد يكون الحدود الحقيقية في تقدم الذكاء الاصطناعي العام - وليس فقط نماذج أكبر. •دقة 29.72٪ في لوحة المتصدرين الرسمية ل ARC-AGI-2 • يستخدم نموذج 4B معامل يتفوق على نماذج أكبر وأكثر تكلفة على نفس المعيار. • تكلفة الاستدلال هي فقط 0.20 دولار لكل مهمة، مدعومة بالبيانات التركيبية، والتدريب أثناء الاختبار، وأدوات NVIDIA NeMo.
@nvidia تعديل: عذرا، الدرجة 27.64٪، ارتكبت خطأ. لكن مع ذلك كان مذهلا للغاية
‏‎38.09‏K