70%的生产AI团队使用开源模型。72.5%将代理连接到数据库,而不是聊天界面。这就是375名技术构建者实际交付的内容——与Twitter AI完全不同。 70%的团队在某种程度上使用开源模型。48%将他们的策略描述为主要是开放的。22%承诺仅使用开放的。只有11%保持完全专有。 现场的代理是系统操作员,而不是聊天界面。我们原以为代理主要会调用API。相反,72.5%连接到数据库。61%连接到网络搜索。56%连接到内存系统和文件系统。47%连接到代码解释器。 重心在于数据和执行,而不是对话。复杂的团队构建MCP以访问他们自己的内部系统(58%)和外部API(54%)。 合成数据在评估中比训练更具动力。65%使用合成数据进行评估生成,而24%用于微调。这表明在合成训练数据规模扩大之前,评估数据市场、场景库和失败模式语料库将会出现短期激增。 时机揭示了堆栈的走向。团队需要在扩展生产之前验证正确性。 88%使用自动化方法来改善上下文。然而,这仍然是部署AI产品时的首要痛点。工具采用与问题解决之间的差距指向了一个根本性挑战。 工具是存在的。问题比更好的检索或更智能的分块所能解决的要困难。 团队需要在扩展生产之前验证正确性。工具是存在的。问题比更好的检索所能解决的要困难。 上下文仍然是真正的挑战,也是下一代AI基础设施最大的机会。 在这里探索完整的互动数据集:或阅读Lauren的完整分析: