你正在谷歌进行AI工程师面试。 面试官问: “我们的数据分散在多个来源(Salesforce、Gmail、Drive等) 你会如何构建一个统一的查询引擎?” 你:“我会将所有内容嵌入到一个向量数据库中并进行RAG。” 面试结束! 许多开发者仍然认为上下文检索是一个线性管道: 块 → 嵌入 → 检索 → 生成 这在简单演示中效果很好,但生产系统需要一些根本不同的东西。 为了更好地理解,考虑这个查询: “将我们在芝加哥地区的Q4销售业绩与去年在与利益相关者会议中制定的预测进行比较。” 这个单一查询需要: - 来自你的SQL数据库的销售数据 - 图形关系(组织层级) - 对预测报告的向量搜索 - 基于时间的过滤(今年的Q4与去年的Q4) - 权限检查(用户授权) ...