Якщо ви замислюєтесь, чи означає насичення ARC-AGI-1 чи 2, що тепер у нас є AGI... Я звертаюся до того, що я казав, коли ми запускали ARC-AGI-2 минулого року (це те саме, що я казав, коли ми оголошували про вихід ARC-AGI-2 навесні 2022 року, до появи чат-ботів LLM)... Серія ARC-AGI — це не поріг AGI, це компас, який вказує науковій спільноті на правильні питання. ARC-AGI-1 — це мінімальний тест на флюїдний інтелект: щоб його пройти, потрібно було показати ненульовий флюїдний інтелект. Це вимагало від ШІ перейти за межі класичної парадигми глибокого навчання / LLM попереднього масштабування + статичних моделей на висновку і перейти до адаптації під час тестування. ARC-AGI-2 такий самий, але з завданнями, що досліджують глибші рівні складності мислення (особливо щодо композиції концепцій). Втім, це завдання, які можуть розв'язати звичайні люди за кілька хвилин без зовнішнього використання інструментів (ми найняли наших тестувальників з вулиці), тому це не є верхньою межею того, чого може досягти людський флюїнд інтелект (наприклад, розв'язання проблеми тисячоліття). ARC-AGI-3 (запуск у березні 2026 року) досліджує інтерактивне мислення: ми оцінюємо, як системи досліджують невідомі середовища, моделюють його, ставлять власні цілі та планують/реалізують ці цілі, автономно, без інструкцій. Ми також почали роботу над ARC-AGI-4 та ARC-AGI-5, чим я дуже захоплений!