Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ajans üreticileri için banger kağıdı.
Çok ajanlı sistemler genellikle beklentileri yetersiz sunar. Sorun, ajanların kendilerinin nasıl inşa edildiğinde değil. Organizasyonları bu.
Çoğunlukla sabit zincirler, ağaçlar ve görevler geliştikçe uyum sağlayamayan grafiklerle inşa ediliyorlar.
Peki ya sistem kendi koordinasyon kalıplarını öğrenebilseydi?
Bu yeni araştırma, el yapımı topolojilere dayanmak yerine ajanları dinamik olarak yönetmeyi öğrenen bir çerçeve olan Puppeteer'ı tanıtıyor.
İşbirliği yapılarını önceden tanımlamak yerine, orkestratör gelişen konuşma durumuna göre hangi ajanın bir sonraki konuşmasını seçer. Politika, REINFORCE ile eğitilir ve doğrudan görev başarısı için optimize edilir.
Karmaşık grafik topolojileri üzerinde arama yapmak yerine, her şeyi ardışık ajan seçimlerine serileştirirler. Bu yeniden çerçeveleme, kombinatoryal karmaşıklığı aşıyor.
Ortaya çıkan şaşırtıcı: kompakt döngüsel desenler doğal olarak gelişir. Geniş grafikler değil, 2-3 ajanın işin çoğunu yaptığı sıkı döngüler.
Dikkat çekici olan ise, sistemin verimliliği kendi kendine keşfetmesidir.
Sonuç -ları:
- GSM-Hard matematik problemlerinde: %70 doğruluk (sadece temel model için %13,5 iken).
- MMLU-Pro'da: %83 (%76 başlangıç seviyesine karşılık).
- SRDD yazılım geliştirme üzerine: %76,4 (%60,6 temel seviyeye karşılık).
Bu kazançlar, token tüketiminin azalmasıyla birlikte gelir. Makale, gösterge maliyetlerinin eğitim boyunca sürekli olarak azaldığını ve performansın arttığını gösteriyor.
Ayrıca ajan seçim sürecinin Markov özelliklerini tatmin ettiğini kanıtlıyorlar; yani mevcut durum tek başına optimal bir sonraki ajanı belirliyor. Tam geçmişi takip etmeye gerek yok.
Yapay zeka geliştiricileri için neden önemlidir: Öğrenilmiş sadelik, mühendislik karmaşıklığından daha iyidir. Birkaç uzman ajana sahip eğitilmiş bir yönlendirici, karmaşık el yapımı iş akışlarını geride bırakarak hesaplama yükünü azaltabilir.

En İyiler
Sıralama
Takip Listesi

