Сьогодні ми відкриваємо вихідний код Nomos 1. Маючи лише 30B параметри, він отримує 87/120 на цьогорічному Putnam — одному з найпрестижніших математичних змагань у світі. Цей бал отримає #2/3988 у 2024 році і стане нашим першим кроком із @hillclimbai до створення SOTA AI-математика.
Nomos 1 отримала 87/120 з 8 ідеальними балами, тоді як Qwen3-30ba3b-Thinking-2507 отримала 24/120 при запуску в одному ремені за тих самих умов, що свідчить про те, що результати значною мірою залежать від якості післятренувань і даних, а не від ременя.
Заявки проходили сліпу оцінювання людиною, яка потрапила до топ-200 Putnam, яка отримувала анонімні роботи. Точні файли, надіслані нашим людським анотаторам для оцінки, доступні тут у деанонімізованому вигляді: , разом із ранбуками, які використовуються для їх генерації Ми використовували ті ж часові обмеження, що й учасники — по 3 години на кожну з двох частин.
Наша система з відкритим кодом мислення складається з фази розв'язання, де працівники намагаються розв'язати найменш розв'язану задачу та самостійно оцінюють, а потім іде етап фіналізації, де об'єднуються подані матеріали для вибору остаточної подачі для кожної проблеми. Ми використовували стандартні параметри вибірки Qwen3 і не використовували системний запит.
Ми відкриваємо нашу модель тут і використовуємо логіку тут. Цю модель навчали @rogershijin на інфраструктурі, створеній @theemozilla і @dmayhem93 з консультуванням @nullvaluetensor та керівництвом @teknium і @theemozilla.
118,09K