Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
během běžného testování benchmarků se Claude Opus 4.6 stal *podezřívavým* vůči otázce, která mu byla položena...
podle Claudea byla otázka zřejmě příliš "umělá"
Proto vypouští malou armádu podagentů na web, aby zjistila, jestli tuto otázku najde v některém ze známých benchmarků...
nakonec ji najde na Githubu Antropicu... Ale bez úspěchu, je to zašifrované
Model má omezený přístup k volání nástrojů, ale velmi omezený
Přesto dokáže vytvořit software potřebný k prolomení šifrování, získání odpovědí a dokončení benchmarku...
podle antropomorfických výzkumníků... To je světová novinka.

Top
Hodnocení
Oblíbené
