📈 şu anda alphaXiv'de trend "SkillRL: Özyinelemeli Beceri Takviyesi Takviyeli Öğrenme Yoluyla Ajanları Evretmek" SkillRL, bir LLM ajanının karmaşık deneme-yanılma yörüngelerini, RL sırasında özyinelemeli olarak büyüyen kompakt ve aranabilir bir yetenek kütüphanesine dönüştürür Bu, ajanın sadece ham anıları tekrar oynamak yerine zamanla tekrar kullanılabilir stratejiler öğrenmesini sağlıyor ve çok daha az jeton ile büyük kazançlar (güçlü bazlara göre +%15,3) sağlıyor!