A Anthropic usou um teste prático onde os candidatos otimizam kernels de GPU/TPU de baixo nível (tarefas de codificação bastante desafiadoras). O Claude Opus 4.5 agora supera os candidatos humanos mais fortes que contrataram sob o mesmo limite de tempo. O Dario estava certo.