Сегодня мы открываем исходный код Nomos 1. С всего лишь 30B параметрами, он набрал 87/120 на этом году Putnam, одном из самых престижных математических конкурсов в мире. Этот результат занял бы #2/3988 в 2024 году и стал нашим первым шагом с @hillclimbai к созданию SOTA AI математика.
Nomos 1 набрал 87/120 с 8 идеальными оценками, в то время как Qwen3-30ba3b-Thinking-2507 набрал 24/120 при запуске в том же хранилище в тех же условиях, что указывает на то, что производительность в значительной степени обусловлена постобучением и качеством данных, а не хранилищем.
Работы оценивались анонимно человеком, который занимал место в топ-200 конкурса Putnam и получил анонимные submissions. Точные файлы, отправленные нашим аннотаторам для оценки, доступны здесь в деанонимизированном виде: , вместе с руководствами, использованными для их генерации. Мы использовали те же временные ограничения, что и у участников - 3 часа для каждой из двух частей.
Наша система рассуждений с открытым исходным кодом состоит из фазы решения, в которой работники пытаются решить наименее решённую задачу и самооценку, за которой следует фаза финализации, которая консолидирует представления для выбора окончательного представления для каждой задачи. Мы использовали параметры выборки по умолчанию Qwen3 и не использовали системный запрос.
Мы открываем исходный код нашей модели здесь и нашу логику здесь. Эта модель была обучена @rogershijin на инфраструктуре, созданной @theemozilla и @dmayhem93, с советами от @nullvaluetensor и руководством от @teknium и @theemozilla.
118,1K