Vi introduserer NousCoder-14b, en konkurrerende olympiadeprogrammeringsmodell. Vår siste blogg beskriver fullstendige funn fra omfattende eksperimenter og logger med fullstacken som er utgitt – RL-miljøet, benchmark og harness bygget i Atropos, alt fullt reproduserbart med vår åpne treningsstack. NousCoder-14b ble etteropplært på Qwen3-14B av en forsker @JoeLi5050 bruk av 48 B200 over fire dager, vårt Atropos-rammeverk og @modal sin autoskaler. Den oppnår en Pass@1 nøyaktighet på 67,87 %, +7,08 % over Qwens grunnleggende nøyaktighet ved bruk av verifiserbare utførelsesbelønninger.