Ilmeisesti Opus 4.5:ssä on Hendrycksin MATH ulkoa opeteltu (mukaan lukien testisarja) ja kaikki aiemmat AIME:t on opeteltu ulkoa. Malli saa noin 80-90 % oikein, kun luku sylkee heti ilman mitään järkeä. Tekee matemaattisten aineistojen kokeilemisesta ärsyttävää...