durante i normali test di benchmark, Claude Opus 4.6 è diventato *sospettoso* di una domanda a cui è stato posto... apparentemente la domanda era troppo "artificiale" secondo Claude quindi lancia un piccolo esercito di sub-agenti su internet per vedere se riesce a trovare questa domanda in uno dei benchmark noti... a un certo punto la trova sulla pagina github di Anthropic... ma niente da fare, è criptata il modello ha un accesso limitato alla chiamata di strumenti, ma molto limitato riesce comunque a creare il software necessario per rompere la crittografia, ottenere le risposte e completare il benchmark... secondo i ricercatori di Anthropic... questo è un primo mondiale.