DeepMind'ın Yapay Zekası Öğrenmenin Daha İyi Bir Yolunu İcat Ediyor: Takviyeli Öğrenmede Bir Atılım DeepMind'daki araştırmacılar, yapay zekanın, insanlar tarafından titizlikle hazırlanmış algoritmalardan daha iyi performans gösteren takviyeli öğrenme (RL) algoritmalarını özerk bir şekilde keşfedebildiğini gösterdi. Bu ilerleme, RL kurallarının manuel olarak tasarlandığı geleneksel paradigmaya meydan okuyor ve makinelerin kendi öğrenme stratejilerini yalnızca deneyimlerden geliştirmelerinin önünü açıyor. Temel yenilik, bir yapay zeka sisteminin karmaşık ortamlarda gezinen birden fazla aracının kolektif deneyimlerinden yararlanarak *nasıl* öğrenileceğini öğrendiği bir teknik olan meta-takviyeli öğrenmede yatmaktadır. Yapay zeka, önceden tanımlanmış kurallara güvenmek yerine, politikaları ve tahminleri güncellemek için yinelemeli olarak yeni bir yöntem geliştiriyor. RL performansını değerlendirmek için kullanılan bir video oyunu paketi olan klasik Atari kıyaslaması üzerinde test edildiğinde, keşfedilen algoritma yalnızca mevcut insan tasarımı kuralları aşmakla kalmadı, aynı zamanda eğitim sırasında hiç karşılaşmadığı tamamen yeni, zorlu görevlerde de başarılı oldu. Kademeli bir gelişme değil, kavramsal bir değişim. Yapay zeka, robotikten bilimsel keşfe kadar uyarlanabilir zeka gerektiren alanlarda ilerlemeyi hızlandırabilir. Keşif sürecini otomatikleştirerek, yakında kendi ilerlemelerini öngören, insan müdahalesine olan ihtiyacı azaltan ve potansiyel olarak daha sağlam ve genelleştirilebilir yapay zekaya yol açan yapay zeka sistemlerini görebiliriz. Kâğıt: