1/ 如果 DeepSeek-Math-V2 是最近得分跃升至 38/50 的原因,那么在其发布后的一天内,将一个 ~700GB 的模型适配到一台 H100 上,每个数学问题的运行时间大约为 6 分钟(这些是 Kaggle 的限制),将是一个令人印象深刻的成就。