📈 ahora en tendencia en alphaXiv "SkillRL: Evolución de Agentes a través del Aprendizaje por Refuerzo Aumentado por Habilidades Recursivas" SkillRL convierte las trayectorias desordenadas de prueba y error de un agente LLM en una biblioteca de habilidades compacta y buscable que crece recursivamente durante el AR Esto permite que el agente realmente aprenda estrategias reutilizables con el tiempo en lugar de simplemente reproducir recuerdos en bruto, ¡lo que genera grandes ganancias (+15.3% sobre bases sólidas) con muchos menos tokens!