Anthropic использовал тест на дом, где кандидаты оптимизируют низкоуровневые ядра GPU/TPU (довольно сложные задачи программирования). Claude Opus 4.5 теперь обходит самых сильных человеческих кандидатов, которых они наняли в тех же временных рамках. Дарио был прав.