Tilsynelatende har Opus 4.5 hendrycks MATEMATIKK memorert (inkludert testsettet) og alle tidligere AIME-er også memorert. Modellen får omtrent 80-90 % riktig når den spytter ut tallet umiddelbart uten noen resonnering. Det gjør det irriterende å eksperimentere på matematiske datasett...