Anthropic刚刚在他们测试过的每位人类工程师中得分最高。 Claude Opus 4.5于昨天发布,超越了GPT-5.1-Codex-Max、Gemini 3 Pro以及他们内部编码考试中的每一位人类候选人。 这是没人谈论的事情: