Terobosan besar di sini! Akhirnya, agen Anda dapat belajar seperti manusia: Agent Reinforcement Trainer (ART) adalah kerangka kerja untuk melatih agen LLM multi-langkah untuk tugas-tugas dunia nyata menggunakan GRPO. Anda hanya perlu beberapa baris kode. Tidak perlu hadiah manual! 100% sumber terbuka.