DeepSeekの新モデル、DeepSeek-Math-V2を理解するための画像です! DeepSeekはちょうどDeepSeek-Math-V2をリリースしました! はい、これは数学的推論のためのドメイン固有のモデルであり、今回はDeepSeek-V3.2を基にポストトレーニングやファインチューニングを行っています。つまり、DeepSeekは完全に新しいアーキテクチャに切り替えたということです。 成績面では、IMO 2025(国際数学オリンピック)は83.3%に達し、IMO金メダルレベルに達しました。 ProofBench-Basicは直接復習し、99%のスコアを獲得し、他のすべてのモデルを圧倒しました。 ProofBench-AdvancedはGemini Deep Thinkに次ぐ2番目です(これは純粋なモデルではなくエージェントを持つプラットフォームです)。 ちなみに、今年のIMO 2025は我が国で初めてのイベントでもあります。 次に、DeepSeek-Math-V2の83.3%のスコアを各問題に直接平均し、252問中210点、83.3%の精度、つまりアメリカ(216点)と韓国(203点)の間に位置する、つまり3位のスコアになるはずです。