DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Wow ! DeepSeekMath-V2 Architecture Générateur-Vérificateur à nouveau ! ... Vers un raisonnement mathématique auto-vérifiable, nous étudions comment former un vérificateur basé sur LLM précis et fidèle pour la démonstration de théorèmes. Nous formons ensuite un générateur de preuves en utilisant le vérificateur comme modèle de récompense, et incitons le générateur à identifier et résoudre autant de problèmes que possible dans ses propres preuves avant de les finaliser. Pour maintenir l'écart génération-vérification à mesure que le générateur devient plus fort, nous proposons de mettre à l'échelle le calcul de vérification pour étiqueter automatiquement de nouvelles preuves difficiles à vérifier, créant ainsi des données d'entraînement pour améliorer davantage le vérificateur. Notre modèle résultant, DeepSeekMath-V2, démontre de fortes capacités de démonstration de théorèmes, atteignant des scores de niveau or sur l'IMO 2025 et le CMO 2024 et un presque parfait 118/120 sur le Putnam 2024 avec un calcul de test à l'échelle. Bien qu'il reste beaucoup de travail, ces résultats suggèrent que le raisonnement mathématique auto-vérifiable est une direction de recherche faisable qui pourrait aider à développer des systèmes d'IA mathématiques plus capables.

Meilleurs

Classement

Favoris