.@NVIDIA hat gerade einen erstaunlichen Coup mit einem kleinen 4B-Modell gelandet, das viel größere Systeme bei ARC AGI 2, 29,72% / $0,20 pro Aufgabe geschlagen hat! Durch den Einsatz von synthetischen Daten und Testzeit-Training anstelle von brutaler Skalierung hat das NVARC-Team bewiesen, dass cleveres Design die rohe Parameteranzahl übertreffen kann. Es ist ein aufregendes Signal, dass effizientes, adaptives Denken möglicherweise die wahre Grenze im AGI-Fortschritt sein könnte - nicht nur immer größere Modelle. •29,72% Genauigkeit auf der offiziellen ARC-AGI-2-Rangliste • Verwendet ein 4B-Parameter-Modell, das viel größere, teurere Modelle im gleichen Benchmark schlägt. • Die Inferenzkosten betragen nur $0,20 pro Aufgabe, ermöglicht durch synthetische Daten, Testzeit-Training und NVIDIA NeMo-Tools.
@nvidia Edit: Entschuldigung, der Punktestand beträgt 27,64 %, ich habe einen Fehler gemacht. Aber trotzdem unglaublich beeindruckend
38,09K