📈 ahora en tendencia en alphaXiv "SkillRL: Agentes en evolución mediante aprendizaje por refuerzo recursivo aumentado por habilidades" SkillRL convierte las desordenadas trayectorias de prueba y error de un agente LLM en una biblioteca de habilidades compacta y buscable que crece recursivamente durante la vida real Esto permite que el agente aprenda estrategias reutilizables con el tiempo en lugar de simplemente repasar recuerdos en bruto, generando grandes ganancias (+15,3% sobre las líneas base sólidas) con muchos menos tokens.