DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Wir stellen NousCoder-14b vor, ein wettbewerbsfähiges Olympiade-Programmiermodell. Unser neuester Blog beschreibt die vollständigen Ergebnisse aus umfangreichen Experimenten und Protokollen mit dem vollständigen Stack, der veröffentlicht wurde - die RL-Umgebung, Benchmark und das in Atropos integrierte Harness, alles vollständig reproduzierbar mit unserem offenen Trainings-Stack. NousCoder-14b wurde von dem Forscher in Residence @JoeLi5050 auf Qwen3-14B nachtrainiert, wobei 48 B200s über einen Zeitraum von 4 Tagen verwendet wurden, unser Atropos-Framework und @modal's Autoscaler. Es erreicht eine Pass@1-Genauigkeit von 67,87 %, +7,08 % über der Basisgenauigkeit von Qwen unter Verwendung von verifizierbaren Ausführungsbelohnungen.

Top

Ranking

Favoriten