Anthropic đã sử dụng một bài kiểm tra tại nhà, nơi các ứng viên tối ưu hóa các kernel GPU/TPU cấp thấp (các nhiệm vụ lập trình khá thách thức). Claude Opus 4.5 giờ đây vượt qua những ứng viên con người mạnh nhất mà họ đã thuê trong cùng một thời gian giới hạn. Dario đã đúng.