DeepSeek právě provedl ten typ vylepšení, jaký si každý model rozumu předstírá. Místo toho, aby vypouštěl dlouhý řetězec myšlenek a doufal, že to dává smysl, DeepSeek Math V2 provádí kompletní průzkum vlastní logiky. Postaví důkaz, zaútočí na něj, zkontroluje útok, zkontroluje kontrolu, opraví chyby a opakuje smyčky, dokud se už nemůže rozbít. Tato jediná myšlenka úplně změnila jeho výkon. Tady je, co tato úroveň sebereflexe přinesla: • Zlatá úroveň na IMO 2025 • Zlatá úroveň na CMO 2024 • 118/120 na Putnam 2024, nejvyšší zaznamenané skóre • Lepší výsledky než GPT-5 Thinking a Gemini 2.5 Pro v nejtěžších kategoriích Tajemství není v měřítku. Je to architektura kolem modelu: — ověřovatele, který hledá logické mezery — meta-ověřovatele, který zpochybňuje ověřovatele — generátor důkazů podmíněný tak, aby se vyhnul slabému uvažování — smyčka, která nutí každou část systému být ostřejší Proces probíhá jako mlýnek: - Vytvořit důkaz - Otestujte to - Testovat testera - Opravit uvažování -Opakovat Zaměřili se na skutečný problém matematického uvažování: model může trefit správnou odpověď z nesprávných důvodů. DeepSeek proto vycvičil ověřovatele, který hodnotí důvody, ne výsledky....