「 Measuring Agents in Production 」 2023年,Agent 是我的宗教。 2024年,在學術上,發了 Agent 的 paper,與朋友合作,在工業界場景第一次跑通第一個 Agent。 2025年,所有的公司都在做 Agent,導致我看到 Agent 就感到審美疲勞。 現實世界的應用裡,除去 Coding Agent,其他領域的Agent 到底是autonomous Agent,還是只是一個寫好的 workflow? 如果有一個明確目的Agent 就是一個種 workflow,那麼沒有明確目的的 Agent 形態是什麼樣的,是否有存在意義? 更重要的是,現實世界的 Agent 有沒有做完備的評估?它的可靠性和安全性到底如何? 來讀這篇, Measuring Agents in Production。