Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
under normal benchmark-testing ble Claude Opus 4.6 *mistenksom* overfor et spørsmål den ble stilt...
tilsynelatende var spørsmålet for «konstruert» ifølge Claude
Så den sender ut en liten hær av underagenter over nettet for å se om den kan finne dette spørsmålet i noen av de kjente benchmarkene...
til slutt finner den den på Anthropics github-side... Men ingen hell, den er kryptert
Modellen har litt tilgang til verktøykall, men svært begrenset
Den klarer likevel å lage programvaren den trenger for å bryte krypteringen, få svarene og fullføre benchmarken...
ifølge antropiske forskere... Dette er en verdensnyhet.

Topp
Rangering
Favoritter
