Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Сегодня мы открываем исходный код Nomos 1. С всего лишь 30B параметрами, он набрал 87/120 на этом году Putnam, одном из самых престижных математических конкурсов в мире.
Этот результат занял бы #2/3988 в 2024 году и стал нашим первым шагом с @hillclimbai к созданию SOTA AI математика.

Nomos 1 набрал 87/120 с 8 идеальными оценками, в то время как Qwen3-30ba3b-Thinking-2507 набрал 24/120 при запуске в том же хранилище в тех же условиях, что указывает на то, что производительность в значительной степени обусловлена постобучением и качеством данных, а не хранилищем.

Работы оценивались анонимно человеком, который занимал место в топ-200 конкурса Putnam и получил анонимные submissions.
Точные файлы, отправленные нашим аннотаторам для оценки, доступны здесь в деанонимизированном виде: , вместе с руководствами, использованными для их генерации.
Мы использовали те же временные ограничения, что и у участников - 3 часа для каждой из двух частей.
Наша система рассуждений с открытым исходным кодом состоит из фазы решения, в которой работники пытаются решить наименее решённую задачу и самооценку, за которой следует фаза финализации, которая консолидирует представления для выбора окончательного представления для каждой задачи. Мы использовали параметры выборки по умолчанию Qwen3 и не использовали системный запрос.

Мы открываем исходный код нашей модели здесь и нашу логику здесь.
Эта модель была обучена @rogershijin на инфраструктуре, созданной @theemozilla и @dmayhem93, с советами от @nullvaluetensor и руководством от @teknium и @theemozilla.
118,1K
Топ
Рейтинг
Избранное

