📈 acum în trend pe alphaXiv "SkillRL: Agenți în evoluție prin învățare prin întărire recursivă augmentată de abilități" SkillRL transformă traiectoriile dezordonate de încercare și eroare ale unui agent LLM într-o bibliotecă de abilități compactă și căutabilă care crește recursiv în timpul RL Acest lucru îi permite agentului să învețe strategii reutilizabile în timp, în loc să revadă doar amintiri brute, obținând câștiguri mari (+15,3% față de linii de bază puternice) cu mult mai puține jetoane!