Avancée massive ici ! Enfin, vos agents peuvent apprendre comme des humains : Agent Reinforcement Trainer (ART) est un cadre pour entraîner des agents LLM multi-étapes pour des tâches du monde réel en utilisant GRPO. Vous avez juste besoin de quelques lignes de code. Pas de récompenses manuelles nécessaires ! 100 % open-source.