📈 nu trending op alphaXiv "SkillRL: Evoluerende Agenten via Recursieve Vaardigheid-Aangevulde Versterkingsleren" SkillRL verandert de rommelige trial-and-error trajecten van een LLM-agent in een compacte en doorzoekbare vaardighedenbibliotheek die recursief groeit tijdens RL Dit stelt de agent in staat om daadwerkelijk herbruikbare strategieën in de loop van de tijd te leren in plaats van alleen maar rauwe herinneringen af te spelen, wat grote winsten oplevert (+15,3% ten opzichte van sterke baselines) met veel minder tokens!