Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Wow ! DeepSeekMath-V2
Architecture Générateur-Vérificateur à nouveau !
... Vers un raisonnement mathématique auto-vérifiable, nous étudions comment former un vérificateur basé sur LLM précis et fidèle pour la démonstration de théorèmes. Nous formons ensuite un générateur de preuves en utilisant le vérificateur comme modèle de récompense, et incitons le générateur à identifier et résoudre autant de problèmes que possible dans ses propres preuves avant de les finaliser. Pour maintenir l'écart génération-vérification à mesure que le générateur devient plus fort, nous proposons de mettre à l'échelle le calcul de vérification pour étiqueter automatiquement de nouvelles preuves difficiles à vérifier, créant ainsi des données d'entraînement pour améliorer davantage le vérificateur. Notre modèle résultant, DeepSeekMath-V2, démontre de fortes capacités de démonstration de théorèmes, atteignant des scores de niveau or sur l'IMO 2025 et le CMO 2024 et un presque parfait 118/120 sur le Putnam 2024 avec un calcul de test à l'échelle. Bien qu'il reste beaucoup de travail, ces résultats suggèrent que le raisonnement mathématique auto-vérifiable est une direction de recherche faisable qui pourrait aider à développer des systèmes d'IA mathématiques plus capables.

Meilleurs
Classement
Favoris

