これは大きな突破口です! 最後に、エージェントは人間のように学習できるようになります: エージェント強化トレーナー(ART)は、GRPOを用いて多段階のLLMエージェントを実際のタスクに訓練するためのフレームワークです。 数行のコードだけで十分です。手動の報酬は不要です! 100%オープンソースです。