Acesta este cel mai important chart din lume și merge absolut nebunește
METR
METRCu 8 ore în urmă
Estimăm că Claude Opus 4.6 are un orizont de timp de 50% de aproximativ 14,5 ore (IC 95% de la 6 ore la 98 de ore) pentru sarcinile software. Deși aceasta este cea mai mare estimare pe care am raportat-o, această măsurătoare este extrem de zgomotoasă deoarece suita noastră actuală de sarcini este aproape saturată.
Versiunea liniară este complet nebunească. superexponențial
Pentru cei neinițiați, aceasta înseamnă: (anume) sarcini care în mod normal ar dura 14 ore pentru un utilizator uman pot fi realizate acum de AI (într-un timp mult mai scurt, probabil minute) cu o probabilitate de 50% asta înseamnă 4,5 ordine de mărime față de 2019, sau o creștere de 26.000 de ori față de GPT-2
17