もしARC-AGI-1や2が飽和したことで、今やAGIができたのか気になるなら...昨年ARC-AGI-2をリリースした際に言ったこと(これは2022年春にARC-AGI-2が登場すると発表した時と同じで、LLMチャットボットの台頭前の話でもあります)... ARC-AGI系列はAGIの閾値ではなく、研究コミュニティを正しい問いへと導く羅針盤です。 ARC-AGI-1は流体知能の最低限のテストで、合格するには非ゼロの流体知能を示す必要がありました。これには、AIが従来のディープラーニング/LLMパラダイムである事前学習のスケーリング+静的モデルの推論から、テスト時の適応へと移行する必要がありました。 ARC-AGI-2も同じですが、特に概念構成に関して、より深い推論の複雑さを探る課題が加わります。それでも、これらは外部の道具を使わずに数分で解決できる課題です(私たちは現場で試験を受ける人を雇いました)ため、人間の流体知能が達成できる上限(例えばミレニアム問題の解決)を代表するものではありません。 ARC-AGI-3(2026年3月開始予定)はインタラクティブ推論を探求します。システムがどのように未知の環境を探索し、モデル化し、自らの目標を設定し、指示なしに自律的にこれらの目標に向かって計画・実行するかを評価します。 また、ARC-AGI-4とARC-AGI-5の作業も始めており、とても楽しみにしています!