ARC-AGI-1 mi yoksa 2 mi doygunlaşması artık AGI'ye sahip olduğumuz anlamına mı geliyor diye merak ediyorsanız... Geçen yıl ARC-AGI-2'yi başlattığımızda söylediklerime atıfta bulunuyorum (aynı zamanda ARC-AGI-2'nin geleceğini duyurduğumuzda da aynı şey, 2022 baharında, LLM sohbet botlarının yükselişinden önce)... ARC-AGI serisi bir AGI eşiği değil, araştırma topluluğunu doğru sorulara yönlendiren bir pusuladır. ARC-AGI-1, akışkan zekasının minimal bir testidir — geçmek için sıfır olmayan akışkan zekasını göstermeniz gerekiyordu. Bu, yapay zekanın klasik derin öğrenme / LLM paradigmasının ötesine geçip, ön ölçeklendirme + çıkarımda statik modelleri test zamanına uyum sağlamaya doğru ilerlemesini gerektirdi. ARC-AGI-2 de aynıdır, ancak özellikle kavram bileşimi açısından daha derin akıl yürütme karmaşıklığı seviyelerini araştıran görevlerle birlikte. Yine de, bunlar sıradan insanlar tarafından harici araç kullanmadan dakikalar içinde çözülebilen görevler (test yapanlarımızı sokaktan işe aldık), bu yüzden insan akışkan zekasının başarabileceği üst sınırı temsil etmez (örneğin bir Millennium problemini çözmek). ARC-AGI-3 (Mart 2026'da başlayacak) etkileşimli akıl yürütmeyi inceler: sistemlerin bilinmeyen ortamları nasıl keşfettiğini, modellediğini, kendi hedeflerini nasıl belirlediğini ve bu hedeflere nasıl ulaştığını, talimatlar olmadan, özerk şekilde planlayıp uyguladığını değerlendiririz. Ayrıca ARC-AGI-4 ve ARC-AGI-5 üzerinde çalışmaya başladık, bu beni oldukça heyecanlandırıyor!