Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Çok ajanlı sistemler genellikle hayal kırıklığı mı olur?
Sorun ajanların kendisinde değil, organizasyonlarının şeklindedir.
Çoğu sistem, görev değiştikçe ayarlanamayan sabit bir zincir, ağaç veya grafik yapısına sahiptir.
Peki ya sistem kendi iş birliği modelini öğrenebilirse?
Bu büyük rekorları kıran makale, önceden tasarlanmış topolojilere dayanmak yerine ajanları dinamik olarak düzenleyen Puppeteer adlı bir çerçeve tanıtıyor.
Anahtar nokta:
• Artık önceden tanımlanmış iş birliği yapıları değil, koordinatörlerin değişen konuşma durumlarına göre bir sonraki konuşmacıyı seçtiği ajanlar.
• Görevlerin başarı oranlarını doğrudan optimize etmek için REINFORCE algoritmalarını kullanarak stratejiler eğitin.
• Karmaşık grafik topolojileri aramak yerine her şeyi sürekli ajan seçimine seri hale getirerek kombinatoryal karmaşıklıktan kaçının.
Sonuçlar şaşırtıcı:
Büyük bir grafik yapısı yerine, doğal olarak kompakt bir döngüsel desen oluşur ve burada 2-3 ajanın çoğu işi üstlenir.
Daha da güçlü olan, sistemin verimliliği otonom olarak keşfedebilmesidir.
Başarı Gösterimi:
• GSM-Hard matematik problemlerinde: %70 doğruluk (yalnızca temel model kullanıldığında bu oran %13,5).
• MMLU-Pro'da: %83 (başlangıçta %76) elde edildi.
• SRDD yazılım geliştirme konusunda: %76,4 (başlangıç %60,6) elde edildi.
Bu artışlar, token tüketiminde azalma ile birlikte gelir.
Makale, token maliyetlerinin azalmaya devam ettiğini, performansın ise eğitim boyunca arttığını gösteriyor.
Ayrıca, ajan seçim sürecinin Markov özelliğini sağladığını gösterdiler; yani mevcut durum, tam geçmişi takip etmeye gerek kalmadan optimal bir sonraki ajanı belirler.
Öyle:
Yapay zeka geliştiricileri için, öğrenmenin basitliği, dikkatli tasarımın karmaşıklığından daha ağır basar.
Birkaç özel ajana sahip eğitilmiş bir yönlendirici, iyi tasarlanmış iş akışlarını geride bırakırken hesaplama yükünü azaltır.

Kağıt bağlantısı:
11,41K
En İyiler
Sıralama
Takip Listesi

