Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Yapay Zeka Ajanları için hafızayı iyileştirme üzerine YENİ araştırmalar.
(yer imlerine işaret ediyor)
Bağlam pencereleri milyonlarca tokena kadar ölçeklendikçe, dar boğaz ham kapasiteden bilişsel kontrole kayıyor. Ne bildiğini bilmek, eksik olanı bilmek ve ne zaman duracağını bilmek, her tokenı işlemekten daha önemlidir.
Daha uzun bağlam pencereleri daha iyi mantık sağlamaz. Bunun büyük nedeni, geliştiricilerin bugün ultra uzun belgeleri işleme şeklinin bağlam penceresini genişletmesi veya her şeyi tek bir geçişte sıkıştırması halindeydi.
Ancak kesin kanıtlar az ve milyonlarca token arasında dağınık olduğunda, pasif hafıza stratejileri çoklu mantık için gerekli olan köprü gerçeklerini sessizce reddeder.
Bu yeni araştırma, yapılandırılmış PRETHINK–RETRIEVE–WRITE protokolü aracılığıyla uzun belge soru yanıtlamaya System-2 tarzı bilişsel kontrolü uygulayan sınırlı bellek ajanı InfMem'i tanıtıyor.
InfMem her segmenti akış sırasında pasif olarak sıkıştırmak yerine, belleğinin soruyu yanıtlamak için yeterli olup olmadığını aktif olarak izler. Mevcut kanıtlar yeterli mi? Ne eksik? Belgenin neresine bakmalıyım?
PRETHINK, bilişsel bir kontrolör olarak hareket eder ve daha fazla kanıt mı yoksa durdurma mı gerektiğine karar verir. Kanıt boşlukları olduğunda, hedefli bir geri alma sorgusu sentezler ve belgenin herhangi bir yerinden, önceden geçtiği bölümler de dahil olmak üzere, ilgili pasajları getirir. WRITE daha sonra ortak sıkıştırma yapar ve alınan kanıtları mevcut segmentle sabit bir bütçe altında sınırlı bir belleğe entegre eder.
Eğitim tarifi, Qwen3-32B'den damıtma yoluyla protokol mekaniğini öğretmek için SFT ısınma kullanır, ardından pekiştirme öğrenimi, geri getirme, yazma ve durdurma kararlarını son görev doğruluğuyla uyumlu hale getirir; sonuç odaklı ödüller ve erken durma şekillendirme yöntemi kullanılır.
32k'dan 1M token'a kadar ultra uzun QA kıyaslamalarında, InfMem MemAgent'ı sırasıyla Qwen3-1.7B, Qwen3-4B ve Qwen2.5-7B üzerinden +10.17, +11.84 ve +8.23 ortalama mutlak doğruluk puanları ile geride bırakıyor.
4B parametreli InfMem ajanı, YaRN gibi standart bazların tek haneli performansa düştüğü 1M token'a kadar tutarlı doğruluk sağlar. Çıkarım gecikmesi adaptif erken durma yoluyla ortalama 3,9 kat azalır (5,1 kata kadar).
Bu kazanımlar ayrıca LongBench QA (QA) ile de aktarılır; burada InfMem+RL YaRN tabanına göre bireysel görevlerde +31,38'e kadar mutlak iyileştirme sağlar.
Makale:
Akademimizde etkili yapay zeka ajanları oluşturmayı öğrenin:

En İyiler
Sıralama
Takip Listesi
