Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

elvis
Yapay Zeka Ajanları ile İnşa @dair_ai • Önce: Meta AI, Galactica LLM, Elastic, PaperswithCode, PhD • LLM'ler ve AI Ajanları ⬇️ ile nasıl inşa edileceği hakkında görüşler paylaşıyorum
LLM'ler için ajanik akıl yürütme üzerine etkileyici bir anket.
(bunu yer imlerine işaretler)
135+ sayfa!
Neden önemli?
LLM'ler kapalı dünya ortamlarında iyi mantık yürütür, ancak bilginin evrildiği açık uçlu, dinamik ortamlarda zorlanırlar.
Eksik parça aksiyon. Bunun nedeni, etkileşim olmadan statik akıl yürütmenin geri bildirimden uyum sağlayamaması, öğrenmesi veya gelişmesidir.
Bu yeni anket, LLM'lerin çevreleriyle sürekli etkileşim yoluyla plan yapan, hareket eden ve öğrenen özerk ajanlar olarak yeniden çerçevelendiği Ajanik Akıl Yürütme paradigmasını sistematik hale getiriyor.
Düşünceler ve eylemleri birleştiren birleşik bir yol haritası sunar; çevresel dinamikler ve optimizasyon ayarları arasında ajanik sistemler inşa etmek için uygulanabilir rehberlik sunar.
Çerçeve, ajanik akıl yürütmeyi üç tamamlayıcı boyut boyunca düzenler:
1. Temel Ajanik Akıl Yürütme: Planlama, araç kullanımı ve arama dahil olmak üzere temel tek ajan yetenekleri. Ajanlar hedefleri ayrıştırır, harici araçları çağırır ve yürütülebilir eylemlerle sonuçları doğrular. Burası temel kaya.
2. Kendi Kendini Evrimleştiren Ajanik Akıl Yürütme: Ajanların geri bildirim, hafıza ve uyum yoluyla nasıl geliştiği. Sabit akıl yürütme yollarını takip etmek yerine, ajanlar yansıtma, eleştiri ve hafıza odaklı öğrenme mekanizmaları geliştirir. Refleksiyon, hafıza için RL ve sürekli adaptasyon, akıl yürütmeyi öğrenmeyle ilişkilendirir.
3. Kolektif Çok Ajanlı Akıl Yürütme: İzole çözücülerden işbirlikçi ekosistemlere zekanın ölçeklendirilmesi. Birden fazla ajan, rol atama, iletişim protokolleri ve paylaşılan bellek aracılığıyla koordinasyon sağlar. Tartışma, anlaşmazlık çözümü ve çoklu turlu etkileşimlerle tutarlılık.
Tüm katmanlarda anket, iki optimizasyon modunu ayırt eder: bağlam içi akıl yürütme (parametre güncellemesi olmadan düzenleme ve arama yoluyla çıkarım-zaman hesaplamasını ölçeklendirme) ve eğitim sonrası akıl yürütme (gerçek anlam yoluyla stratejilerin içselleştirilmesi ve ince ayarlama).
Anket, matematik keşifleri, bilimsel keşif, bedenli robotik, sağlık ve otonom web araştırmaları gibi uygulamaları kapsamaktadır. Ayrıca ajanik yeteneklerin değerlendirilmesi için kıyaslama ortamını da inceler.
Bu araştırma alanına yakından bakıyorum ve işte kalan bazı açık zorluklar şunlar: kişiselleştirme, uzun vadeli etkileşim, dünya modelleme, ölçeklenebilir çok ajanlı eğitim ve gerçek dünyada dağıtım için yönetişim çerçeveleri.
Makale:
Akademimizde etkili yapay zeka ajanları oluşturmayı öğrenin:

387
Yapay zeka ajanları daha iyi bir bellek kontrolüne ihtiyaç duyar, daha fazla bağlam değil.

DAIR.AI21 Oca 23:43
Daha fazla bağlam daha iyi ajanlar anlamına gelmez.
Ajanın hafızasına yönelik mevcut yaklaşım, tüm geçmiş etkileşimleri prompta ekleyerek transkript tekrarıdır. Daha fazla tarih, daha fazla bilgi, daha iyi kararlar.
Alternatif ise, geçmiş etkileşimleri dışarıdan saklarak ve ilgili eserleri her turda geri aldığınız geri alma tabanlı bellektir.
Bir dereceye kadar etkili olsa da, her iki yaklaşım da etkileşimler uzadıkça başarısız oluyor.
Transkript tekrarı sınırsız bağlam büyümesine yol açar, dikkat seçiciliğini azaltır ve erken hataların tekrar tekrar maruz kalma yoluyla devam etmesini sağlar.
Geri getirme, kararın önemi değil, anlamsal benzerlik için optimize eder ve seçim hataları turlar arasında biriktirilir.
Bu yeni makale, transkript tekrarını her turda çevrimiçi güncellenen sınırlı bir iç durumla değiştiren biyo-esinli bir bellek kontrolcüsü olan Agent Cognitive Compressor'u (ACC) tanıtıyor.
Ajanların ihtiyacı olan şey daha fazla bağlam değil, daha iyi hafıza kontrolü.
ACC, yalnızca karar-kritik değişkenleri içeren şema tarafından yönetilen bir temsil olan Sıkıştırılmış Bilişsel Durum (CCS) sürdürür: hedefler, kısıtlamalar, varlıklar, ilişkiler ve belirsizlik sinyalleri.
Her turda ACC aday eserlerini geri çağırır, onları bir nitelik kapısından filtreler ve sadece bir sonraki duruma geçenleri yapar.
Önemli olarak, ACC eseri geri çağırmayı eyalet taahhüdünden ayırır. Alınan içerik, sadece şema kısıtlı sıkıştırma yoluyla bir sonraki durumu etkileyebilir. Bu, doğrulanmamış içeriğin kalıcı hafıza haline gelmesini engeller.
BT operasyonları, siber güvenlik yanıtı ve sağlık iş akışlarını kapsayan 600 canlı değerlendirme (30.000 tur) boyunca, ACC sınırlı hafıza sürdürdü ve transkripsiyon tekrarı doğrusal olarak büyüdü. ACC, 50 turluk bölümlerde neredeyse sıfır halüsinasyon ve sürüklenme oranları elde ederken, başlangıç ve geri alma ajanları stres dönüşlerinden sonra artan arızalar gösterdi.
Geri alma ajanı, sürüklenme artışını sınırlamak için geri çağırmayı tur başına sadece 3 artefaktla sınırlamayı gerektiriyordu. Yine de seçim hataları istikrarsızlığa yol açtı.
Çok turlu ajan arızaları, eksik bilgiden çok zayıf bellek kontrolünden kaynaklanır. Bilişsel sıkıştırma, güvenilir uzun ufuk ajanlar için pratik bir temel sağlar.
Makale:
Akademimizde etkili yapay zeka ajanları oluşturmayı öğrenin:

10
En İyiler
Sıralama
Takip Listesi
