Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Presentiamo NousCoder-14b, un modello di programmazione per olimpiadi competitivo.
Il nostro ultimo blog dettaglia i risultati completi di esperimenti e registrazioni approfondite con l'intero stack rilasciato - l'ambiente RL, il benchmark e l'harness costruito in Atropos, tutto completamente riproducibile con il nostro stack di addestramento aperto.
NousCoder-14b è stato post-addestrato su Qwen3-14B da un ricercatore in residenza @JoeLi5050 utilizzando 48 B200s nel corso di 4 giorni, il nostro framework Atropos e l'autoscaler di @modal. Raggiunge un'accuratezza Pass@1 del 67,87%, +7,08% rispetto all'accuratezza di base di Qwen utilizzando ricompense di esecuzione verificabili.

Principali
Ranking
Preferiti
