PMPP-Eval 更新來了,慶祝新的 SOTA 模型在 CUDA 任務上的表現, Gemini 3 Pro 現在是 pmpp-eval 中得分最高的模型,甚至以相當大的優勢超越了新的 GPT 5.1 High。到目前為止,這是一個很棒的發布,這只是預覽,我們甚至還沒有深度思考可用。