Anthropic utilizó una prueba para llevar a casa donde los candidatos optimizan núcleos de GPU/TPU de bajo nivel (tareas de codificación bastante desafiantes). Claude Opus 4.5 ahora supera a los candidatos humanos más fuertes que contrataron bajo el mismo límite de tiempo. Dario tenía razón.