Burada büyük bir atılım var! Son olarak, ajanlarınız insanlar gibi öğrenebilir: Ajan Reinforcement Trainer (ART), GRPO kullanarak gerçek dünya görevleri için çok adımlı LLM ajanlarını eğitmek için bir çerçevedir. Sadece birkaç satır kod yeterli. Manuel ödüllere gerek yok! %100 açık kaynak.