в ходе обычного тестирования производительности Claude Opus 4.6 стал *подозрительным* к вопросу, который ему задали... по всей видимости, вопрос был слишком "искусственным", по мнению Claude поэтому он запускает небольшую армию подагентов по всему интернету, чтобы выяснить, может ли он найти этот вопрос в каких-либо известных бенчмарках... в конце концов он находит его на странице github Anthropic... но без удачи, он зашифрован модель имеет небольшой доступ к вызову инструментов, но очень ограниченный тем не менее, она все же умудряется создать необходимое программное обеспечение, чтобы сломать шифрование, получить ответы и завершить бенчмарк... по словам исследователей Anthropic... это первый в мире случай.