Si te preguntas si saturar ARC-AGI-1 o 2 significa que ahora tenemos AGI... Te remito a lo que dije cuando lanzamos ARC-AGI-2 el año pasado (que es también lo mismo que dije cuando anunciamos que ARC-AGI-2 llegaría, en primavera de 2022, antes del auge de los chatbots LLM)... La serie ARC-AGI no es un umbral de AGI, es una brújula que apunta a la comunidad investigadora hacia las preguntas correctas. ARC-AGI-1 es una prueba mínima de inteligencia fluida: para aprobarla, necesitabas demostrar inteligencia fluida distinta de cero. Esto requirió que la IA superara el paradigma clásico de aprendizaje profundo / LLM de escalado previo a entrenamiento + modelos estáticos en la inferencia, hacia la adaptación en tiempo de prueba. ARC-AGI-2 es igual, pero con tareas que exploran niveles más profundos de complejidad de razonamiento (particularmente en lo que respecta a la composición de conceptos). Aun así, son tareas que la gente normal puede resolver en minutos sin uso de herramientas externas (contratamos a nuestros examinados en la calle), así que no representan el límite superior de lo que la inteligencia fluida humana puede lograr (por ejemplo, resolver un problema del Milenio). ARC-AGI-3 (lanzamiento en marzo de 2026) explora el razonamiento interactivo: evaluamos cómo los sistemas exploran entornos desconocidos, los modelamos, establecen sus propios objetivos y planifican/ejecutan hacia estos objetivos, de forma autónoma, sin instrucciones. También hemos empezado a trabajar en ARC-AGI-4 y ARC-AGI-5, ¡lo cual me entusiasma bastante!