.@NVIDIA klarte nettopp å gjøre et fantastisk stikk med en liten 4B-modell som slo langt større systemer på ARC AGI 2, 29,72 % / 0,20 dollar per oppgave! Ved å lene seg på syntetiske data og testtidstrening i stedet for brute-force-skala, beviste NVARC-teamet at smart design kan overgå rå parameterantall. Det er et spennende signal om at effektiv, adaptiv resonnement kan være den virkelige grensen i AGI-utviklingen – ikke bare stadig større modeller. •29,72 % nøyaktighet på den offisielle ARC-AGI-2-ledertavlen • Bruker en 4B-parametermodell som slår langt større, dyrere modeller på samme benchmark. • Slutningskostnaden er bare 0,20 dollar per oppgave, muliggjort av syntetiske data, testtidstrening og NVIDIA NeMo-verktøy.
@nvidia Redigering: beklager at poengsummen er 27,64 %, jeg gjorde en feil. Men fortsatt utrolig imponerende
38,09K