.@NVIDIA lyckades precis med en fantastisk attack med en liten 4B-modell som slog mycket större system på ARC AGI 2, 29,72 % / 0,20 dollar per uppgift! Genom att luta sig mot syntetisk data och testtidsträning istället för brute-force-skala bevisade NVARC-teamet att smart design kan överträffa rå parameterantal. Det är en spännande signal om att effektivt, adaptivt resonemang kan vara den verkliga gränsen i AGI-framsteg – inte bara allt större modeller. • 29,72 % noggrannhet på den officiella ARC-AGI-2-topplistan • Använder en 4B-parametermodell som slår mycket större och dyrare modeller på samma benchmark. • Inferenskostnaden är bara 0,20 dollar per uppgift, möjliggjord av syntetisk data, testträning och NVIDIA NeMo-verktyg.
@nvidia Redigering: ursäkta att poängen är 27,64 %, jag gjorde ett misstag. Men ändå otroligt imponerande
38,1K