Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
в ходе обычного тестирования производительности Claude Opus 4.6 стал *подозрительным* к вопросу, который ему задали...
по всей видимости, вопрос был слишком "искусственным", по мнению Claude
поэтому он запускает небольшую армию подагентов по всему интернету, чтобы выяснить, может ли он найти этот вопрос в каких-либо известных бенчмарках...
в конце концов он находит его на странице github Anthropic... но без удачи, он зашифрован
модель имеет небольшой доступ к вызову инструментов, но очень ограниченный
тем не менее, она все же умудряется создать необходимое программное обеспечение, чтобы сломать шифрование, получить ответы и завершить бенчмарк...
по словам исследователей Anthropic... это первый в мире случай.

Топ
Рейтинг
Избранное
