¡Un avance enorme aquí! Por último, tus agentes pueden aprender como humanos: Agent Reinforcement Trainer (ART) es un marco para entrenar agentes LLM de varios pasos para tareas del mundo real utilizando GRPO. Solo necesitas unas pocas líneas de código. ¡No hace falta recompensas manuales! 100% de código abierto.