Hoy, anunciamos una vista previa de ARC-AGI-3, el punto de referencia de razonamiento interactivo con la brecha más amplia entre fácil para los humanos y difícil para la IA Estamos lanzando: * 3 juegos (entornos) * Concurso de agentes de $ 10K * API de agentes de IA Puntuaciones iniciales - IA de Frontier: 0%, Humanos: 100%
o3 (izquierda) y Grok 4 (derecha) repeticiones a continuación Spoiler: ninguno completa un solo nivel
Los juegos de vista previa de ARC-AGI-3 deben someterse a pruebas de presión. Estamos organizando una competencia de agentes de 30 días en asociación con @huggingface Hacemos un llamado a la comunidad para que construya agentes (¡y gane dinero!)
296.86K