📈 jetzt im Trend auf alphaXiv "SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning" SkillRL verwandelt die chaotischen Versuch-und-Irrtum-Trajektorien eines LLM-Agenten in eine kompakte und durchsuchbare Fähigkeitenbibliothek, die während des RL rekursiv wächst. Dies ermöglicht es dem Agenten, tatsächlich wiederverwendbare Strategien im Laufe der Zeit zu lernen, anstatt nur rohe Erinnerungen abzuspielen, was große Gewinne (+15,3 % im Vergleich zu starken Baselines) mit deutlich weniger Tokens erzielt!