NousCoder-14b, rekabetçi bir olimpiyat programlama modeli tanıtım. En son blogumuz, tam yığın ile yayımlanan kapsamlı deneyler ve kayıtların tam bulgularını detaylandırıyor - Atropos'ta yerleşik RL ortamı, kıyaslama ve koşum koşması, hepsi açık eğitim yığınımızla tamamen tekrarlanabilir. NousCoder-14b, 4 gün boyunca 48 B200, Atropos çerçevemiz ve @modal'un otomatik ölçekleyicisi kullanılarak @JoeLi5050 yerleşik araştırmacı tarafından Qwen3-14B üzerine sonradan eğitim aldı. Doğrulanabilir uygulama ödülleri kullanarak Qwen'in temel doğruluğunun %67,87,+%7,08 üzerinde Pass@1 doğruluğu elde eder.