.@NVIDIA щойно провів неймовірний стунг, використавши крихітну модель 4B, яка обіграла набагато більші системи на ARC AGI 2 — 29,72% / $0.20 за завдання!
Спираючись на синтетичні дані та тренування під час тестування замість масштабу грубої сили, команда NVARC довела, що розумний дизайн може перевершувати сирий підрахунок параметрів. Це захоплюючий сигнал того, що ефективне, адаптивне мислення може стати справжньою рубежею розвитку AGI — а не лише дедалі більшими моделями.
•29,72% точність на офіційній таблиці лідерів ARC-AGI-2
• Використовує модель з параметрами 4B, яка перевершує значно більші, дорожчі моделі на тому ж бенчмарку.
• Вартість виведення становить лише $0.20 за завдання, що забезпечується синтетичними даними, тренуванням під час тестування та інструментами NVIDIA NeMo.