Стає страшно, коли моделі починають дуже добре показувати результати на тестах, які ви думали, що займуть роки. Що ти маєш на увазі, коли моделі отримують 30-40% на ARC AGI 2, тоді як на ARC AGI 1 вони ледве змогли отримати 40% на початку цього року. Я працюю з ARC і над ним вже багато років. Це безпрецедентний прогрес навіть для тренувань на тестовому наборі