Vă prezentăm NousCoder-14b, un model competitiv de programare pentru olimpiade. Cel mai recent blog al nostru detaliază concluziile complete din experimente extinse și jurnale cu stack-ul complet lansat – mediul RL, benchmark-ul și harness-ul construite în Atropos, toate complet reproductibile cu stack-ul nostru de antrenament deschis. NousCoder-14b a fost post-instruit pe Qwen3-14B de către cercetătorul rezident @JoeLi5050 folosind 48 de B200 pe parcursul a 4 zile, cadrul nostru Atropos și autoscaler-ul @modal. Aceasta atinge o acuratețe Pass@1 de 67,87%, +7,08% față de acuratețea de bază a Qwen, folosind recompensele verificabile de execuție.