Схоже, що в Opus 4.5 запам'ятав математику Гендріка (включно з тестовим набором) і всі попередні AIME також запам'ятовані. Модель отримує приблизно 80-90% правильно, коли одразу видає цифру без жодних міркувань. Це дратує експерименти з математичними наборами даних...