.@NVIDIA acaba de realizar una increíble hazaña utilizando un pequeño modelo de 4B que superó a sistemas mucho más grandes en ARC AGI 2, 29,72% / $0.20 por tarea! Al apoyarse en datos sintéticos y entrenamiento en el momento de la prueba en lugar de escalar a lo bruto, el equipo de NVARC demostró que un diseño inteligente puede superar la cantidad de parámetros en bruto. Es una señal emocionante de que el razonamiento eficiente y adaptativo podría ser la verdadera frontera en el progreso de la AGI, no solo modelos cada vez más grandes. •29.72% de precisión en la tabla de clasificación oficial de ARC-AGI-2 • Utiliza un modelo de 4B parámetros que supera a modelos mucho más grandes y costosos en el mismo estándar. • El costo de inferencia es de solo $0.20 por tarea, habilitado por datos sintéticos, entrenamiento en el momento de la prueba y herramientas de NVIDIA NeMo.
@nvidia Edit: lo siento, la puntuación es del 27.64%, cometí un error. Pero sigue siendo increíblemente impresionante
38,09K