DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Hoy abrimos el código de Nomos 1. Con solo 30B de parámetros, obtiene 87/120 en el Putnam de este año, una de las competiciones matemáticas más prestigiosas del mundo. Esta puntuación lo clasificaría en el #2/3988 en 2024 y marca nuestro primer paso con @hillclimbai hacia la creación de un matemático AI SOTA.

Nomos 1 logró un 87/120 con 8 puntuaciones perfectas, mientras que Qwen3-30ba3b-Thinking-2507 obtuvo 24/120 cuando se ejecutó en el mismo arnés bajo las mismas condiciones, lo que indica que el rendimiento se debe en gran medida a la calidad de los datos y al post-entrenamiento en lugar del arnés.

Las presentaciones fueron calificadas de forma anónima por un concursante humano del Putnam que se encontraba entre los 200 mejores y que recibió las presentaciones de forma anonimizada. Los archivos exactos enviados a nuestros anotadores humanos para la calificación están disponibles aquí desanonimizados: , junto con los manuales utilizados para generarlos. Utilizamos los mismos límites de tiempo que los competidores: 3 horas para cada una de las dos partes.

Nuestro sistema de razonamiento de código abierto consta de una fase de resolución, donde los trabajadores intentan un problema menos resuelto y se autoevalúan, seguida de una fase de finalización, que consolida las presentaciones para elegir una presentación final para cada problema. Utilizamos los parámetros de muestreo predeterminados de Qwen3 y no se utilizó un aviso del sistema.

Abrimos nuestro modelo aquí y nuestra razón aquí. Este modelo fue entrenado por @rogershijin en una infraestructura construida por @theemozilla y @dmayhem93 con asesoramiento de @nullvaluetensor y liderazgo de @teknium y @theemozilla.

118,11K

Parte superior

Clasificación

Favoritos