PMPP-Eval 更新来了,庆祝新的 SOTA 模型在 CUDA 任务上的表现, Gemini 3 Pro 现在是 pmpp-eval 中得分最高的模型,甚至以相当大的优势超过了新的 GPT 5.1 High。到目前为止,这是一个很棒的发布,这只是预览,我们甚至还没有深度思考可用。