📈 agora em alta no alphaXiv "SkillRL: Agentes Evolutivos por Aprendizado por Reforço Recursivo Aumentado por Habilidades" O SkillRL transforma as trajetórias confusas de tentativa e erro de um agente LLM em uma biblioteca de habilidades compacta e pesquisável que cresce recursivamente durante o RL Isso permite que o agente aprenda estratégias reutilizáveis ao longo do tempo, em vez de apenas rejogar memórias brutas, gerando grandes ganhos (+15,3% sobre bases fortes) com muito menos tokens!