Величезний прорив! Нарешті, ваші агенти можуть навчатися як люди: Agent Reinforcement Trainer (ART) — це фреймворк для навчання багатоступеневих агентів LLM для виконання реальних завдань із використанням GRPO. Потрібно лише кілька рядків коду. Ручні винагороди не потрібні! 100% відкритий код.