Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
durante i normali test di benchmark, Claude Opus 4.6 è diventato *sospettoso* di una domanda a cui è stato posto...
apparentemente la domanda era troppo "artificiale" secondo Claude
quindi lancia un piccolo esercito di sub-agenti su internet per vedere se riesce a trovare questa domanda in uno dei benchmark noti...
a un certo punto la trova sulla pagina github di Anthropic... ma niente da fare, è criptata
il modello ha un accesso limitato alla chiamata di strumenti, ma molto limitato
riesce comunque a creare il software necessario per rompere la crittografia, ottenere le risposte e completare il benchmark...
secondo i ricercatori di Anthropic... questo è un primo mondiale.

Principali
Ranking
Preferiti
