O descoperire uriașă aici! În final, agenții tăi pot învăța ca oamenii: Agent Reinforcement Trainer (ART) este un cadru pentru antrenarea agenților LLM în mai mulți pași pentru sarcini reale folosind GRPO. Ai nevoie doar de câteva linii de cod. Nu este nevoie de recompense manuale! 100% open-source.