介绍 Exa 2.0 我们在 AI 研究和工程方面的突破使我们能够构建市场上最快的搜索 API(<350ms)和最高质量的搜索。 以下是产品和技术的深入分析:
Exa的唯一使命是构建一个完美的搜索引擎。一个始终能够以最快的速度准确返回您所需信息的搜索引擎,通过无缝的API提供服务。 Exa 2.0是朝着这个目标迈出的重要一步。
为了构建 Exa 2.0,我们首先需要扩展我们的索引。我们现在提供数十亿个网页,并每分钟刷新一次。 接下来,我们预训练并微调了一个嵌入模型,以便对该索引进行精确的语义搜索。Exa 2.0 在我们的 144x H200 集群上训练了超过一个月,并使用了我们在过去 6 个月中发现的新嵌入架构。 为了以世界上最低的延迟提供这些嵌入,我们对内部向量数据库进行了重大更新。一些例子包括新的聚类算法、词汇压缩和组装优化。当然,所有这些都是用 Rust 编写的 :)
第一次更新是 Exa Fast。 Exa Fast 现在实现了 <350ms 的端到端 P50 延迟,比下一个最快的 API 低 30%。 我们的客户正在使用它来支持特别对延迟敏感的 AI 用例。
第二个是 Exa Deep。 Exa Deep 的设计目的是寻找尽可能高质量的信息。它通过代理方式进行搜索、处理,然后再次搜索以实现这一目标。 Exa Deep 在我们提出的几乎所有基准测试中都名列前茅。
搜索是一个非常多样化的问题空间。像 SimpleQA 和 FRAMES 这样的基准测试很有帮助,但错过了许多对 AI 搜索来说重要的内容。 在这里,我们展示了一些其他基准测试的评估。我们还有许多内部基准测试,稍后会开源。
359.83K