熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
一圖看懂 DeepSeek 新模型 DeepSeek-Math-V2!
DeepSeek 剛剛發佈了 DeepSeek-Math-V2!
沒錯,這是一個專門面向數學推理領域的領域專用模型,這次是基於 DeepSeek-V3.2 進行後訓練/微調的, 意味著 DeepSeek 已經完全切換到新架構上了.
性能方面 IMO 2025 (國際數學奧林匹克競賽) 刷到了 83.3%, 達到了 IMO 金牌水平. ProofBench-Basic 直接刷爆了, 得分99%, 碾壓其他所有模型. 而 ProofBench-Advanced 僅次於 Gemini Deep Think (這個是帶Agent的平臺, 不是純模型).
順帶, 今年IMO 2025第一也是我國. 然後我把 DeepSeek-Math-V2 這個 83.3% 的得分直接平均到每個問題, 得分應該是210分(滿分252分,83.3%準確率),可以在美國(216分)和韓國(203分)之間,即第3名。

熱門
排行
收藏

