DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Presentamos NousCoder-14b, un modelo de programación competitivo para olimpiadas. Nuestro último blog detalla los hallazgos completos de extensos experimentos y registros con la pila completa lanzada: el entorno de RL, el benchmark y el harness construido en Atropos, todo completamente reproducible con nuestra pila de entrenamiento abierta. NousCoder-14b fue post-entrenado en Qwen3-14B por el investigador residente @JoeLi5050 utilizando 48 B200s durante un período de 4 días, nuestro marco Atropos y el escalador automático de @modal. Logra una precisión Pass@1 del 67.87%, +7.08% sobre la precisión base de Qwen utilizando recompensas de ejecución verificables.

Parte superior

Clasificación

Favoritos