.@NVIDIA только что провела удивительный трюк, используя крошечную модель на 4B параметров, которая обошла гораздо более крупные системы на ARC AGI 2, 29,72% / $0.20 за задачу! Полагаясь на синтетические данные и обучение во время тестирования вместо грубой силы масштабирования, команда NVARC доказала, что умный дизайн может опередить количество параметров. Это захватывающий сигнал о том, что эффективное, адаптивное рассуждение может стать настоящим рубежом в прогрессе AGI - а не просто все более крупные модели. •29.72% точность на официальной таблице лидеров ARC-AGI-2 • Использует модель на 4B параметров, которая обходит гораздо более крупные и дорогие модели на том же эталоне. • Стоимость вывода составляет всего $0.20 за задачу, что стало возможным благодаря синтетическим данным, обучению во время тестирования и инструментам NVIDIA NeMo.
@nvidia Редактировать: извините, балл составляет 27.64%, я ошибся. Но все равно невероятно впечатляюще
38,09K