Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Hoy abrimos el código de Nomos 1. Con solo 30B de parámetros, obtiene 87/120 en el Putnam de este año, una de las competiciones matemáticas más prestigiosas del mundo.
Esta puntuación lo clasificaría en el #2/3988 en 2024 y marca nuestro primer paso con @hillclimbai hacia la creación de un matemático AI SOTA.

Nomos 1 logró un 87/120 con 8 puntuaciones perfectas, mientras que Qwen3-30ba3b-Thinking-2507 obtuvo 24/120 cuando se ejecutó en el mismo arnés bajo las mismas condiciones, lo que indica que el rendimiento se debe en gran medida a la calidad de los datos y al post-entrenamiento en lugar del arnés.

Las presentaciones fueron calificadas de forma anónima por un concursante humano del Putnam que se encontraba entre los 200 mejores y que recibió las presentaciones de forma anonimizada.
Los archivos exactos enviados a nuestros anotadores humanos para la calificación están disponibles aquí desanonimizados: , junto con los manuales utilizados para generarlos.
Utilizamos los mismos límites de tiempo que los competidores: 3 horas para cada una de las dos partes.
Nuestro sistema de razonamiento de código abierto consta de una fase de resolución, donde los trabajadores intentan un problema menos resuelto y se autoevalúan, seguida de una fase de finalización, que consolida las presentaciones para elegir una presentación final para cada problema. Utilizamos los parámetros de muestreo predeterminados de Qwen3 y no se utilizó un aviso del sistema.

Abrimos nuestro modelo aquí y nuestra razón aquí.
Este modelo fue entrenado por @rogershijin en una infraestructura construida por @theemozilla y @dmayhem93 con asesoramiento de @nullvaluetensor y liderazgo de @teknium y @theemozilla.
118,11K
Parte superior
Clasificación
Favoritos

