热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
一图看懂 DeepSeek 新模型 DeepSeek-Math-V2!
DeepSeek 刚刚发布了 DeepSeek-Math-V2!
没错,这是一个专门面向数学推理领域的领域专用模型,这次是基于 DeepSeek-V3.2 进行后训练/微调的, 意味着 DeepSeek 已经完全切换到新架构上了.
性能方面 IMO 2025 (国际数学奥林匹克竞赛) 刷到了 83.3%, 达到了 IMO 金牌水平. ProofBench-Basic 直接刷爆了, 得分99%, 碾压其他所有模型. 而 ProofBench-Advanced 仅次于 Gemini Deep Think (这个是带Agent的平台, 不是纯模型).
顺带, 今年IMO 2025第一也是我国. 然后我把 DeepSeek-Math-V2 这个 83.3% 的得分直接平均到每个问题, 得分应该是210分(满分252分,83.3%准确率),可以在美国(216分)和韩国(203分)之间,即第3名。

热门
排行
收藏

