70% 的生產 AI 團隊使用開源模型。72.5% 將代理連接到數據庫,而不是聊天介面。這是 375 位技術建設者實際交付的內容 - 它看起來與 Twitter AI 完全不同。 70% 的團隊在某種程度上使用開源模型。48% 將他們的策略描述為主要開放。22% 僅承諾使用開放。只有 11% 保持純專有。 現場的代理是系統操作員,而不是聊天介面。我們原以為代理主要會調用 API。相反,72.5% 連接到數據庫。61% 連接到網絡搜索。56% 連接到記憶系統和文件系統。47% 連接到代碼解釋器。 重心在於數據和執行,而不是對話。複雜的團隊構建 MCP 以訪問他們自己的內部系統 (58%) 和外部 API (54%)。 合成數據在評估中比訓練更具驅動力。65% 使用合成數據進行評估生成,而 24% 用於微調。這表明在合成訓練數據擴展之前,評估數據市場、場景庫和失敗模式語料庫將會出現短期激增。 時機揭示了堆棧的發展方向。團隊需要在擴大生產之前驗證正確性。 88% 使用自動化方法來改善上下文。然而,這仍然是部署 AI 產品的首要痛點。工具採用與問題解決之間的差距指向了一個根本挑戰。 工具是存在的。問題比更好的檢索或更智能的分塊所能解決的要困難得多。 團隊需要在擴大生產之前驗證正確性的系統。工具是存在的。問題比更好的檢索所能解決的要困難得多。 上下文仍然是真正的挑戰,也是下一代 AI 基礎設施最大的機會。 在這裡探索完整的互動數據集 : 或閱讀 Lauren 的完整分析 :