Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
DeepSeek právě provedl ten typ vylepšení, jaký si každý model rozumu předstírá.
Místo toho, aby vypouštěl dlouhý řetězec myšlenek a doufal, že to dává smysl, DeepSeek Math V2 provádí kompletní průzkum vlastní logiky. Postaví důkaz, zaútočí na něj, zkontroluje útok, zkontroluje kontrolu, opraví chyby a opakuje smyčky, dokud se už nemůže rozbít.
Tato jediná myšlenka úplně změnila jeho výkon.
Tady je, co tato úroveň sebereflexe přinesla:
• Zlatá úroveň na IMO 2025
• Zlatá úroveň na CMO 2024
• 118/120 na Putnam 2024, nejvyšší zaznamenané skóre
• Lepší výsledky než GPT-5 Thinking a Gemini 2.5 Pro v nejtěžších kategoriích
Tajemství není v měřítku.
Je to architektura kolem modelu:
— ověřovatele, který hledá logické mezery
— meta-ověřovatele, který zpochybňuje ověřovatele
— generátor důkazů podmíněný tak, aby se vyhnul slabému uvažování
— smyčka, která nutí každou část systému být ostřejší
Proces probíhá jako mlýnek:
- Vytvořit důkaz
- Otestujte to
- Testovat testera
- Opravit uvažování
-Opakovat
Zaměřili se na skutečný problém matematického uvažování: model může trefit správnou odpověď z nesprávných důvodů. DeepSeek proto vycvičil ověřovatele, který hodnotí důvody, ne výsledky....

Top
Hodnocení
Oblíbené

