Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

Apresentando o NousCoder-14b, um modelo de programação competitivo para olimpíadas. O nosso último blog detalha os resultados completos de extensos experimentos e registos com toda a pilha lançada - o ambiente RL, o benchmark e o harness construído no Atropos, tudo totalmente reproduzível com a nossa pilha de treinamento aberta. O NousCoder-14b foi pós-treinado no Qwen3-14B pelo pesquisador residente @JoeLi5050 usando 48 B200s ao longo de 4 dias, nosso framework Atropos e o autoscaler da @modal. Ele alcança uma precisão Pass@1 de 67.87%, +7.08% em relação à precisão base do Qwen usando recompensas de execução verificáveis.

Top

Classificação

Favoritos