Наконец-то у нас был момент, чтобы запустить нашу систему с GPT-5.2 X-High на ARC-AGI-2! Используя тот же Poetiq harness, что и раньше, мы увидели результаты до 75% при стоимости менее 8 долларов за задачу, используя GPT-5.2 X-High на полном наборе данных PUBLIC-EVAL. Это превосходит предыдущий SOTA примерно на 15 процентных пунктов.