如果你看不見代理的運作,你就無法改善它,無法調試它,也無法信任它。 有多少團隊在建立代理卻沒有辦法理解它們的運作,這真是瘋狂。 完全沒有可觀察性。 這可能是我每次遇到新團隊時問的第一個問題: 你能給我展示幾次代理執行的追蹤嗎? 什麼都沒有。零。毫無。 大型語言模型經常做出糟糕的決策。 代理會失敗,而你不會意識到,直到有人抱怨。 至少,你建立的每個代理都應該產生追蹤,顯示完整的請求流程、延遲分析和系統級性能指標。 僅此一項就能揭示80%的運營問題。 但理想情況下,你可以做得更好,捕捉所有以下內容: • 模型互動 • 令牌使用 • 時間和性能元數據 • 事件執行 如果你想要可靠的代理,觀察性不是可選的。