Tre ting om METR-grafen: 1) Den måler noe ekte ved kodingsevne, men heller ikke akkurat det den hevder å måle 2) Mange andre referansepunkter korrelerer veldig sterkt med det og øker eksponentielt 3 AI forblir hakkete på viktige måter som er vanskelige å måle