エージェントが遅いと感じたり一貫性がなかったりするのは、多くの場合、仕事に適したモデルが間違っているからです。多くのエージェントはすべてのことに対して「最も賢い」モデルをデフォルトで使います。それはスペルチェックにスーパーコンピューターを使うようなものです! よりクリーンな方法は、エージェントがタスクにどれだけのインテリジェンスが必要かを判断させてから応答させることです。 1. エージェントにタスクを単純、創造的、分析的のいずれかに分類してもらう。 2. 単純な作業には軽量モデルにルーティングし、分析が必要な場合のみ重い推論モデルにルーティングします。 この方法を行う人々は、遅延が低く、故障が少なく、大規模にコストが劇的に下がると報告しています。