マルチエージェントシステムはしばしば期待外れになるのでしょうか? 問題はエージェント自身ではなく、彼らの組織の仕方にあるのかもしれません。 ほとんどのシステムは、タスクの変化に合わせて調整できない固定されたチェーン構造、木構造、グラフ構造を持っています。 しかし、もしシステム自身が独自のコラボレーションモデルを学習できたらどうでしょうか? この大作論文は、あらかじめ設計されたトポロジーに頼らず、エージェントを動的にオーケストレーションする「Puppeteer」というフレームワークを紹介しています。 重要なポイントは以下の通りです: • もはやあらかじめ定められたコラボレーション構造ではなく、会話の進行状況の変化に基づいてコーディネーターが次の話者を選ぶエージェントが導入される。 • REINFORCEアルゴリズムを用いて戦略を訓練し、タスク成功率を直接最適化する。 • 複雑なグラフトポロジーを探すのではなく、すべてを連続エージェント選択にシリアライズすることで組合せ的複雑さを回避する。 その結果は驚くべきものです: 巨大なグラフ構造の代わりに、2〜3人のエージェントがほとんどの作業を担うコンパクトな循環パターンが自然に形成されます。 さらに強力なのは、このシステムが自律的に効率を検出できることです。 実績表示: ・GSM-Hard数学問題では、70%の精度(基礎モデル単独で使用した場合の13.5%)。 ・MMLU-Proでは83%(ベースライン時76%)を達成。 ・SRDDソフトウェア開発に関して:76.4%(基準値60.6%)を達成。 これらのブーストはトークン消費の減少を伴います。 論文は、トークンコストが継続的に減少し続ける一方で、トレーニングを通じてパフォーマンスが向上していることを示しています。 また、エージェント選択プロセスがマルコフの性質を満たしていることも示しました。つまり、現在の状態が全履歴を追跡することなく最適な次のエージェントを決定することを意味します。 だから: AI開発者にとって、学習のシンプルさは慎重な設計の複雑さを上回ります。 数名の専門エージェントを備えた訓練済みルーターは、よく設計されたワークフローを上回り、計算負荷を削減します。
論文リンク:
2.06K