Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Сьогодні ми відкриваємо вихідний код Nomos 1. Маючи лише 30B параметри, він отримує 87/120 на цьогорічному Putnam — одному з найпрестижніших математичних змагань у світі.
Цей бал отримає #2/3988 у 2024 році і стане нашим першим кроком із @hillclimbai до створення SOTA AI-математика.

Nomos 1 отримала 87/120 з 8 ідеальними балами, тоді як Qwen3-30ba3b-Thinking-2507 отримала 24/120 при запуску в одному ремені за тих самих умов, що свідчить про те, що результати значною мірою залежать від якості післятренувань і даних, а не від ременя.

Заявки проходили сліпу оцінювання людиною, яка потрапила до топ-200 Putnam, яка отримувала анонімні роботи.
Точні файли, надіслані нашим людським анотаторам для оцінки, доступні тут у деанонімізованому вигляді: , разом із ранбуками, які використовуються для їх генерації
Ми використовували ті ж часові обмеження, що й учасники — по 3 години на кожну з двох частин.
Наша система з відкритим кодом мислення складається з фази розв'язання, де працівники намагаються розв'язати найменш розв'язану задачу та самостійно оцінюють, а потім іде етап фіналізації, де об'єднуються подані матеріали для вибору остаточної подачі для кожної проблеми. Ми використовували стандартні параметри вибірки Qwen3 і не використовували системний запит.

Ми відкриваємо нашу модель тут і використовуємо логіку тут.
Цю модель навчали @rogershijin на інфраструктурі, створеній @theemozilla і @dmayhem93 з консультуванням @nullvaluetensor та керівництвом @teknium і @theemozilla.
118,09K
Найкращі
Рейтинг
Вибране

