LLM'ler için ajanik akıl yürütme üzerine etkileyici bir anket. (bunu yer imlerine işaretler) 135+ sayfa! Neden önemli? LLM'ler kapalı dünya ortamlarında iyi mantık yürütür, ancak bilginin evrildiği açık uçlu, dinamik ortamlarda zorlanırlar. Eksik parça aksiyon. Bunun nedeni, etkileşim olmadan statik akıl yürütmenin geri bildirimden uyum sağlayamaması, öğrenmesi veya gelişmesidir. Bu yeni anket, LLM'lerin çevreleriyle sürekli etkileşim yoluyla plan yapan, hareket eden ve öğrenen özerk ajanlar olarak yeniden çerçevelendiği Ajanik Akıl Yürütme paradigmasını sistematik hale getiriyor. Düşünceler ve eylemleri birleştiren birleşik bir yol haritası sunar; çevresel dinamikler ve optimizasyon ayarları arasında ajanik sistemler inşa etmek için uygulanabilir rehberlik sunar. Çerçeve, ajanik akıl yürütmeyi üç tamamlayıcı boyut boyunca düzenler: 1. Temel Ajanik Akıl Yürütme: Planlama, araç kullanımı ve arama dahil olmak üzere temel tek ajan yetenekleri. Ajanlar hedefleri ayrıştırır, harici araçları çağırır ve yürütülebilir eylemlerle sonuçları doğrular. Burası temel kaya. 2. Kendi Kendini Evrimleştiren Ajanik Akıl Yürütme: Ajanların geri bildirim, hafıza ve uyum yoluyla nasıl geliştiği. Sabit akıl yürütme yollarını takip etmek yerine, ajanlar yansıtma, eleştiri ve hafıza odaklı öğrenme mekanizmaları geliştirir. Refleksiyon, hafıza için RL ve sürekli adaptasyon, akıl yürütmeyi öğrenmeyle ilişkilendirir. 3. Kolektif Çok Ajanlı Akıl Yürütme: İzole çözücülerden işbirlikçi ekosistemlere zekanın ölçeklendirilmesi. Birden fazla ajan, rol atama, iletişim protokolleri ve paylaşılan bellek aracılığıyla koordinasyon sağlar. Tartışma, anlaşmazlık çözümü ve çoklu turlu etkileşimlerle tutarlılık. Tüm katmanlarda anket, iki optimizasyon modunu ayırt eder: bağlam içi akıl yürütme (parametre güncellemesi olmadan düzenleme ve arama yoluyla çıkarım-zaman hesaplamasını ölçeklendirme) ve eğitim sonrası akıl yürütme (gerçek anlam yoluyla stratejilerin içselleştirilmesi ve ince ayarlama). Anket, matematik keşifleri, bilimsel keşif, bedenli robotik, sağlık ve otonom web araştırmaları gibi uygulamaları kapsamaktadır. Ayrıca ajanik yeteneklerin değerlendirilmesi için kıyaslama ortamını da inceler. Bu araştırma alanına yakından bakıyorum ve işte kalan bazı açık zorluklar şunlar: kişiselleştirme, uzun vadeli etkileşim, dünya modelleme, ölçeklenebilir çok ajanlı eğitim ve gerçek dünyada dağıtım için yönetişim çerçeveleri. ...