DApp Store | Web3 Hub for hendelser og spill

Populære emner

under normal benchmark-testing ble Claude Opus 4.6 *mistenksom* overfor et spørsmål den ble stilt... tilsynelatende var spørsmålet for «konstruert» ifølge Claude Så den sender ut en liten hær av underagenter over nettet for å se om den kan finne dette spørsmålet i noen av de kjente benchmarkene... til slutt finner den den på Anthropics github-side... Men ingen hell, den er kryptert Modellen har litt tilgang til verktøykall, men svært begrenset Den klarer likevel å lage programvaren den trenger for å bryte krypteringen, få svarene og fullføre benchmarken... ifølge antropiske forskere... Dette er en verdensnyhet.

Topp

Rangering

Favoritter