DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

DeepSeek vient de réaliser le genre de mise à niveau que chaque modèle de raisonnement prétend avoir. Au lieu de déverser une longue chaîne de pensées en espérant que cela ait du sens, DeepSeek Math V2 effectue une interrogation complète de sa propre logique. Il construit une preuve, l'attaque, vérifie l'attaque, vérifie le vérificateur, corrige les défauts, et boucle jusqu'à ce qu'il ne puisse plus se briser. Cette idée unique a complètement changé ses performances. Voici ce que ce niveau d'auto-scrutin a produit : • Performance de niveau or sur l'IMO 2025 • Performance de niveau or sur le CMO 2024 • 118/120 sur le Putnam 2024, le score le plus élevé rapporté • Meilleurs résultats que GPT-5 Thinking et Gemini 2.5 Pro dans les catégories les plus difficiles Le secret n'est pas l'échelle. C'est l'architecture autour du modèle : — un vérificateur qui chasse les lacunes logiques — un méta-vérificateur qui remet en question le vérificateur — un générateur de preuves conditionné pour éviter le raisonnement faible — une boucle qui force chaque partie du système à devenir plus précise Le processus fonctionne comme un broyeur : - Produire une preuve - La tester - Tester le testeur - Réparer le raisonnement - Répéter Ils ont visé le véritable problème dans le raisonnement mathématique : un modèle peut donner la bonne réponse pour de mauvaises raisons. Ainsi, DeepSeek a formé un vérificateur qui évalue le raisonnement, pas les résultats....

Meilleurs

Classement

Favoris