1/ 如果 DeepSeek-Math-V2 是最近得分從 38/50 跳升的原因,那麼在其發布後的一天內,將一個約 700GB 的模型適配到一個 H100 上,並且每個數學問題的運行時間約為 6 分鐘(這是 Kaggle 的限制),將是一項令人印象深刻的成就。