Et stort gjennombrudd her! Til slutt kan agentene dine lære som mennesker: Agent Reinforcement Trainer (ART) er et rammeverk for å trene flertrinns LLM-agenter for virkelige oppgaver ved bruk av GRPO. Du trenger bare noen få linjer kode. Ingen manuelle belønninger nødvendig! 100 % åpen kildekode.