📈 agora em tendência no alphaXiv "SkillRL: Evolução de Agentes através de Aprendizagem por Reforço Aumentada por Habilidades Recursivas" SkillRL transforma as trajetórias desordenadas de tentativa e erro de um agente LLM em uma biblioteca de habilidades compacta e pesquisável que cresce recursivamente durante a AR Isto permite que o agente realmente aprenda estratégias reutilizáveis ao longo do tempo, em vez de apenas reproduzir memórias brutas, resultando em grandes ganhos (+15,3% em relação a fortes referências) com muito menos tokens!