エージェントが何をしているのか見えなければ、改善もデバッグも信用できません。 理解できないままエージェントを作っているチームがどれだけ多いかは驚きです。 文字通りゼロの観察性です。 これは、私が新しいチームに出会うたびに最初に尋ねる質問の一つです: あなたのエージェントの処刑の痕跡を見せてもらえますか? 灘。ゼロ。全く。 大規模言語モデルは常に悪い判断を下します。 エージェントは失敗しますが、誰かが文句を言うまで気づかないでしょう。 最低限、構築するすべてのエージェントは、リクエストフロー全体、レイテンシ分析、システムレベルの性能指標を示すトレースを生成するべきです。 これだけで運用上の80%の問題が明らかになります。 しかし理想的には、もっと良い方法を作って、以下すべてを捉えることができます。 ・モデル相互作用 ・トークンの使用 • タイミングおよびパフォーマンスメタデータ ・イベント実行 信頼できるエージェントを求めるなら、観察可能性は必須ではありません。