Představujeme NousCoder-14b, model programování soutěžní olympiády. Náš nejnovější blog podrobně popisuje výsledky rozsáhlých experimentů a logů s plným stackem – RL prostředí, benchmark a harness postavený v Atroposu, vše plně reprodukovatelné s naším otevřeným tréninkovým stackem. NousCoder-14b byl posttrénován na Qwen3-14B výzkumníkem v rezidenci, @JoeLi5050 používal 48 B200 během 4 dnů, náš Atropos framework a @modal autoscaler. Dosahuje přesnosti Pass@1 67,87 %, +7,08 % oproti základní přesnosti Qwen díky ověřitelným odměnám za provedení.