.@NVIDIA acabei de fazer uma picada incrível usando um modelo 4B minúsculo que superou sistemas muito maiores no ARC AGI 2, 29,72% / $0,20 por tarefa! Ao se basear em dados sintéticos e treinamento em tempo de teste em vez de escala bruta, a equipe NVARC provou que um design inteligente pode superar a contagem bruta de parâmetros. É um sinal empolgante de que o raciocínio eficiente e adaptativo pode ser a verdadeira fronteira no progresso da AGI – não apenas modelos cada vez maiores. •29,72% de precisão no ranking oficial do ARC-AGI-2 • Utiliza um modelo de 4B parâmetros que supera modelos muito maiores e mais caros no mesmo benchmark. • O custo de inferência é de apenas $0,20 por tarefa, possibilitado por dados sintéticos, treinamento em tempo de teste e ferramentas NVIDIA NeMo.
@nvidia Edit: desculpe, a nota é 27,64%, eu cometi um erro. Mas ainda assim incrivelmente impressionante
38,09K