DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Presentiamo NousCoder-14b, un modello di programmazione per olimpiadi competitivo. Il nostro ultimo blog dettaglia i risultati completi di esperimenti e registrazioni approfondite con l'intero stack rilasciato - l'ambiente RL, il benchmark e l'harness costruito in Atropos, tutto completamente riproducibile con il nostro stack di addestramento aperto. NousCoder-14b è stato post-addestrato su Qwen3-14B da un ricercatore in residenza @JoeLi5050 utilizzando 48 B200s nel corso di 4 giorni, il nostro framework Atropos e l'autoscaler di @modal. Raggiunge un'accuratezza Pass@1 del 67,87%, +7,08% rispetto all'accuratezza di base di Qwen utilizzando ricompense di esecuzione verificabili.

Principali

Ranking

Preferiti