Zrozum DeepSeek nowy model DeepSeek-Math-V2 na jednym obrazku! DeepSeek właśnie wydał DeepSeek-Math-V2! Zgadza się, to model specjalnie zaprojektowany do obszaru rozumowania matematycznego, tym razem oparty na DeepSeek-V3.2, co oznacza, że DeepSeek całkowicie przeszedł na nową architekturę. Jeśli chodzi o wydajność, IMO 2025 (Międzynarodowa Olimpiada Matematyczna) osiągnęło 83,3%, co odpowiada poziomowi złotej medalu IMO. ProofBench-Basic osiągnął niesamowity wynik 99%, miażdżąc wszystkie inne modele. ProofBench-Advanced jest tuż za Gemini Deep Think (to platforma z Agentem, a nie czysty model). Przy okazji, w tym roku IMO 2025 pierwsze miejsce również zdobyło nasze państwo. Następnie obliczyłem, że wynik DeepSeek-Math-V2 na poziomie 83,3% można bezpośrednio uśrednić na każde pytanie, co daje 210 punktów (maksymalnie 252 punkty, 83,3% dokładności), co plasuje się pomiędzy USA (216 punktów) a Koreą (203 punkty), czyli na 3. miejscu.