Tohle je nejdůležitější graf na světě a je naprosto šílený
METR
METRPřed 10 h
Odhadujeme, že Claude Opus 4.6 má časový horizont 50 % kolem 14,5 hodiny (95% CI od 6 do 98 hodin) na softwarové úkoly. Ačkoliv je to nejvyšší bodový odhad, který jsme uvedli, toto měření je extrémně hlučné, protože náš současný soubor úkolů je téměř přeplněný.
Lineární verze je úplně šílená. Superexponenciální
Pro nezasvěcené to znamená: (některé) úkoly, které by běžně lidskému uživateli trvaly 14 hodin, nyní může AI (za mnohem kratší dobu, pravděpodobně minuty) s pravděpodobností 50 % To je 4,5 řádu velikosti od roku 2019, tedy 26 000x více než GPT-2
25