.@NVIDIA právě zvládl úžasný úder s malým modelem 4B, který porazil mnohem větší systémy na ARC AGI 2, 29,72 % / 0,20 $ za úkol!
Tím, že se opírali o syntetická data a trénink v době testování místo hrubé síly, tým NVARC dokázal, že chytrý návrh může předběhnout počet surových parametrů. Je to vzrušující signál, že efektivní, adaptivní uvažování může být skutečnou hranicí pokroku v AGI – nejen stále většími modely.
•29,72% přesnost na oficiálním žebříčku ARC-AGI-2
• Používá model se 4B parametry, který na stejném benchmarku poráží mnohem větší a dražší modely.
• Náklady na inferenci jsou pouze 0,20 $ za úkol, umožněné syntetickými daty, tréninkem v době testu a nástroji NVIDIA NeMo.