Aparentemente, Opus 4.5 tiene memorizada la MATH de Hendryck (incluyendo el conjunto de pruebas) y también todas las AIME anteriores. El modelo acierta entre un 80 y un 90% al soltar el número de inmediato sin ninguna razón. Hace que sea molesto experimentar con conjuntos de datos matemáticos...