我们测试了使用 CLI 工具的编码代理是否足以应对复杂的文档搜索和分析任务 🧪 我们的新 SemTools 基准使用了 1000 篇 @arxiv 论文来比较具有和不具有语义搜索能力的代理: 🔍 具有语义搜索的代理在所有问题类型上提供了更详细、全面的答案 ⚡ 基于 CLI 的方法相对于所需的努力证明了其强大 - Unix 工具为代理提供了 grep、find 和文件系统导航的开箱即用功能 📊 复杂的交叉引用和时间分析任务在使用语义搜索工具时显示出最大的改进 🛠️ SemTools 通过 LlamaParse 将解析和语义搜索能力直接添加到像 @claudeai Code 和 Gemini CLI 这样的命令行代理中 现有的 Unix 工具与语义搜索能力的结合通常可以替代更复杂的 RAG 设置,同时更快地实施并更灵活地使用。 阅读完整的基准结果和方法论: