Dacă te întrebi dacă saturarea ARC-AGI-1 sau 2 înseamnă că avem acum AGI... Vă refer la ce am spus când am lansat ARC-AGI-2 anul trecut (același lucru pe care l-am spus și când am anunțat că ARC-AGI-2 va veni, în primăvara lui 2022, înainte de apariția chatboturilor LLM)... Seria ARC-AGI nu este un prag AGI, ci o busolă care îndrumă comunitatea de cercetare către întrebările potrivite. ARC-AGI-1 este un test minim al inteligenței fluide – pentru a-l promova, trebuia să demonstrezi inteligență fluidă diferită de zero. Aceasta a impus AI să depășească paradigma clasică de deep learning / LLM de pretraining scaling + modele statice la inferență, către adaptarea la timpul testului. ARC-AGI-2 este la fel, dar cu sarcini care explorează niveluri mai profunde de complexitate rațională (în special în ceea ce privește compoziția conceptelor). Totuși, acestea sunt sarcini care pot fi rezolvate în câteva minute de către oameni obișnuiți fără să folosească instrumente externe (ne-am angajat candidații de pe stradă), deci nu reprezintă limita superioară a ceea ce poate realiza inteligența umană fluidă (de exemplu, rezolvarea unei probleme ale Mileniului). ARC-AGI-3 (lansare în martie 2026) analizează raționamentul interactiv: evaluăm modul în care sistemele explorează medii necunoscute, le modelăm, își stabilesc propriile obiective și planificăm/execută astfel de obiective, autonom, fără instrucțiuni. Am început și lucrul la ARC-AGI-4 și ARC-AGI-5, ceea ce mă entuziasmează destul de mult!