📈 ora in tendenza su alphaXiv "SkillRL: Evoluzione degli Agenti tramite Apprendimento per Rinforzo Augmentato da Abilità Ricorsive" SkillRL trasforma le disordinate traiettorie di tentativi ed errori di un agente LLM in una libreria di abilità compatta e ricercabile che cresce ricorsivamente durante l'RL. Questo consente all'agente di apprendere effettivamente strategie riutilizzabili nel tempo invece di riprodurre semplicemente ricordi grezzi, ottenendo grandi guadagni (+15,3% rispetto a forti baseline) con un numero di token molto inferiore!