.@NVIDIA heeft zojuist een geweldige stunt uitgevoerd met een klein 4B-model dat veel grotere systemen op ARC AGI 2 versloeg, 29,72% / $0,20 per taak! Door gebruik te maken van synthetische data en training tijdens de test in plaats van brute kracht, heeft het NVARC-team bewezen dat slimme ontwerpen de ruwe parameter telling kunnen overtreffen. Het is een opwindend signaal dat efficiënte, adaptieve redenering misschien de echte grens is in de vooruitgang van AGI - niet alleen maar steeds grotere modellen. •29,72% nauwkeurigheid op de officiële ARC-AGI-2 ranglijst • Gebruikt een 4B-parameter model dat veel grotere, duurdere modellen op dezelfde benchmark verslaat. • De kosten voor inferentie zijn slechts $0,20 per taak, mogelijk gemaakt door synthetische data, training tijdens de test en NVIDIA NeMo-tools.
@nvidia Bewerking: sorry, de score is 27,64%, ik heb een fout gemaakt. Maar nog steeds ongelooflijk indrukwekkend
38,09K