Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vă prezentăm NousCoder-14b, un model competitiv de programare pentru olimpiade.
Cel mai recent blog al nostru detaliază concluziile complete din experimente extinse și jurnale cu stack-ul complet lansat – mediul RL, benchmark-ul și harness-ul construite în Atropos, toate complet reproductibile cu stack-ul nostru de antrenament deschis.
NousCoder-14b a fost post-instruit pe Qwen3-14B de către cercetătorul rezident @JoeLi5050 folosind 48 de B200 pe parcursul a 4 zile, cadrul nostru Atropos și autoscaler-ul @modal. Aceasta atinge o acuratețe Pass@1 de 67,87%, +7,08% față de acuratețea de bază a Qwen, folosind recompensele verificabile de execuție.

Limită superioară
Clasament
Favorite
