.@NVIDIA právě zvládl úžasný úder s malým modelem 4B, který porazil mnohem větší systémy na ARC AGI 2, 29,72 % / 0,20 $ za úkol! Tím, že se opírali o syntetická data a trénink v době testování místo hrubé síly, tým NVARC dokázal, že chytrý návrh může předběhnout počet surových parametrů. Je to vzrušující signál, že efektivní, adaptivní uvažování může být skutečnou hranicí pokroku v AGI – nejen stále většími modely. •29,72% přesnost na oficiálním žebříčku ARC-AGI-2 • Používá model se 4B parametry, který na stejném benchmarku poráží mnohem větší a dražší modely. • Náklady na inferenci jsou pouze 0,20 $ za úkol, umožněné syntetickými daty, tréninkem v době testu a nástroji NVIDIA NeMo.
@nvidia Edit: omlouvám se, skóre je 27,64 %, udělal jsem chybu. Ale přesto neuvěřitelně působivé
38,08K