当 Gemini 3 Pro 在两周后发布并在离线语言测试中得分 134 时,会非常有趣(Grok 4 Expert 在该测试中的得分已经在 130 左右,Gemini 2.5 Pro 则在 120)。