questo è il grafico più importante al mondo, e sta andando assolutamente alla grande
METR
METR10 ore fa
Stimiamo che Claude Opus 4.6 abbia un orizzonte temporale del 50% di circa 14,5 ore (CI al 95% di 6 ore a 98 ore) per i compiti software. Anche se questo è il punto di stima più alto che abbiamo riportato, questa misurazione è estremamente rumorosa perché il nostro attuale insieme di compiti è quasi saturo.
la versione lineare è completamente folle. superesponenziale
per i neofiti, questo significa: (compiti) che normalmente richiederebbero a un utente umano 14 ore per essere completati, possono ora essere svolti da AI (in un tempo molto più breve, probabilmente minuti) con una probabilità del 50% sono 4,5 ordini di grandezza dal 2019, o un aumento di 26.000 volte rispetto a GPT-2
27