Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Wow! DeepSeekMath-V2
Generator-Verifier-Architektur erneut!
... Auf dem Weg zu selbstverifizierbarem mathematischen Denken untersuchen wir, wie man einen genauen und treuen LLM-basierten Verifier für den Beweis von Theoremen trainiert. Dann trainieren wir einen Beweis-Generator, der den Verifier als Belohnungsmodell nutzt, und motivieren den Generator, so viele Probleme wie möglich in seinen eigenen Beweisen zu identifizieren und zu lösen, bevor er sie finalisiert. Um die Lücke zwischen Generierung und Verifikation aufrechtzuerhalten, während der Generator stärker wird, schlagen wir vor, die Verifikationsrechenleistung zu skalieren, um automatisch neue schwer zu verifizierende Beweise zu kennzeichnen und Trainingsdaten zu erstellen, um den Verifier weiter zu verbessern. Unser resultierendes Modell, DeepSeekMath-V2, zeigt starke Fähigkeiten im Beweis von Theoremen und erreicht Gold-Niveau-Punkte bei IMO 2025 und CMO 2024 sowie eine nahezu perfekte 118/120 bei Putnam 2024 mit skalierter Testzeit-Rechenleistung. Obwohl noch viel Arbeit vor uns liegt, deuten diese Ergebnisse darauf hin, dass selbstverifizierbares mathematisches Denken eine machbare Forschungsrichtung ist, die helfen könnte, leistungsfähigere mathematische KI-Systeme zu entwickeln.

Top
Ranking
Favoriten

