Obrázek pro pochopení nového modelu DeepSeek, DeepSeek-Math-V2! DeepSeek právě vydal DeepSeek-Math-V2! Ano, jedná se o doménově specifický model matematického uvažování, tentokrát založený na DeepSeek-V3.2 pro post-trénování/doladění, což znamená, že DeepSeek zcela přešel na novou architekturu. Co se týče výkonů, IMO 2025 (Mezinárodní matematická olympiáda) dosáhla 83,3 % a dosáhla úrovně zlatých medailí IMO. ProofBench-Basic se přímo vylepšil, dosáhl 99 %, čímž překonal všechny ostatní modely. ProofBench-Advanced je druhý nejvíc po Gemini Deep Think (jedná se o platformu s agentem, ne o čistý model). Mimochodem, letošní IMO 2025 je také první v naší zemi. Pak jsem průměroval skóre DeepSeek-Math-V2 83,3 % přímo na každou otázku a skóre by mělo být 210 z 252 s přesností 83,3 %, což může být mezi Spojenými státy (216 bodů) a Jižní Koreou (203 bodů), tedy 3. místo.