.@NVIDIA ha appena realizzato un'incredibile impresa utilizzando un piccolo modello da 4B che ha battuto sistemi molto più grandi su ARC AGI 2, 29,72% / $0,20 per compito! Affidandosi a dati sintetici e formazione al momento del test invece di una scala di forza bruta, il team NVARC ha dimostrato che un design intelligente può superare il semplice conteggio dei parametri. È un segnale entusiasmante che il ragionamento efficiente e adattivo potrebbe essere la vera frontiera nel progresso dell'AGI - non solo modelli sempre più grandi. •29,72% di accuratezza nella classifica ufficiale di ARC-AGI-2 • Utilizza un modello da 4B parametri che batte modelli molto più grandi e costosi sullo stesso benchmark. • Il costo di inferenza è solo $0,20 per compito, reso possibile da dati sintetici, formazione al momento del test e strumenti NVIDIA NeMo.
@nvidia Modifica: scusa, il punteggio è 27,64%, ho fatto un errore. Ma è comunque incredibilmente impressionante
38,08K