Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Apresentando o NousCoder-14b, um modelo de programação competitivo para olimpíadas.
O nosso último blog detalha os resultados completos de extensos experimentos e registos com toda a pilha lançada - o ambiente RL, o benchmark e o harness construído no Atropos, tudo totalmente reproduzível com a nossa pilha de treinamento aberta.
O NousCoder-14b foi pós-treinado no Qwen3-14B pelo pesquisador residente @JoeLi5050 usando 48 B200s ao longo de 4 dias, nosso framework Atropos e o autoscaler da @modal. Ele alcança uma precisão Pass@1 de 67.87%, +7.08% em relação à precisão base do Qwen usando recompensas de execução verificáveis.

Top
Classificação
Favoritos
