DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

Heute veröffentlichen wir den Quellcode von Nomos 1. Mit nur 30B Parametern erzielt es 87/120 bei diesem Jahr’s Putnam, einem der prestigeträchtigsten Mathematikwettbewerbe der Welt. Dieser Punktestand würde 2024 den 2. Platz von 3988 belegen und markiert unseren ersten Schritt mit @hillclimbai in Richtung der Schaffung eines SOTA KI-Mathematikers.

Nomos 1 erreichte 87/120 mit 8 perfekten Punkten, während Qwen3-30ba3b-Thinking-2507 24/120 erzielte, als es im gleichen Rahmen unter den gleichen Bedingungen ausgeführt wurde, was darauf hindeutet, dass die Leistung hauptsächlich auf das Nachtraining und die Datenqualität zurückzuführen ist, anstatt auf den Rahmen.

Die Einsendungen wurden anonym von einem menschlichen Teilnehmer der Putnam Top 200 bewertet, der anonymisierte Einsendungen erhielt. Die genauen Dateien, die unseren menschlichen Gutachtern zur Bewertung geschickt wurden, sind hier de-anonymisiert verfügbar: , zusammen mit den Handbüchern, die zu ihrer Erstellung verwendet wurden. Wir haben die gleichen Zeitlimits wie die Wettbewerber verwendet - 3 Stunden für jeden der beiden Teile.

Unser Open-Source-Reasoning-System besteht aus einer Lösungsphase, in der Arbeiter versuchen, ein am wenigsten gelöstes Problem zu lösen und sich selbst zu bewerten, gefolgt von einer Finalisierungsphase, die die Einreichungen konsolidiert, um eine endgültige Einreichung für jedes Problem auszuwählen. Wir haben die Standard-Sampling-Parameter von Qwen3 verwendet und keinen System-Prompt.

Wir stellen unser Modell hier als Open Source zur Verfügung und unsere Argumentation hier. Dieses Modell wurde von @rogershijin auf einer Infrastruktur trainiert, die von @theemozilla und @dmayhem93 erstellt wurde, mit Beratung von @nullvaluetensor und Leitung von @teknium und @theemozilla.

118,09K

Top

Ranking

Favoriten