Apresentando o NousCoder-14b, um modelo competitivo de programação olímpica. Nosso blog mais recente detalha as descobertas completas de experimentos extensos e logs com a stack completa lançada – o ambiente RL, benchmark e harness construídos no Atropos, todos totalmente reproduzíveis com nossa stack de treinamento aberta. NousCoder-14b foi treinado após Qwen3-14B por pesquisadores residentes @JoeLi5050 usando 48 B200s ao longo de 4 dias, nosso framework Atropos e o autoescalonador da @modal. Ele alcança uma precisão Pass@1 de 67,87%, +7,08% acima da precisão básica do Qwen usando recompensas de execução verificáveis.