.@NVIDIA właśnie zrealizowało niesamowity ruch, używając małego modelu 4B, który pokonał znacznie większe systemy w ARC AGI 2, 29,72% / 0,20 USD za zadanie! Opierając się na danych syntetycznych i treningu w czasie testu zamiast na skali siłowej, zespół NVARC udowodnił, że sprytne projektowanie może przewyższyć surową liczbę parametrów. To ekscytujący sygnał, że efektywne, adaptacyjne rozumowanie może być prawdziwą granicą postępu w AGI - nie tylko coraz większe modele. •29,72% dokładności na oficjalnej liście liderów ARC-AGI-2 • Używa modelu o 4B parametrach, który pokonuje znacznie większe, droższe modele w tym samym benchmarku. • Koszt wnioskowania wynosi tylko 0,20 USD za zadanie, umożliwiony przez dane syntetyczne, trening w czasie testu i narzędzia NVIDIA NeMo.
@nvidia Edytuj: przepraszam, wynik to 27,64%, popełniłem błąd. Ale nadal niesamowicie imponujące
38,08K