SERA 保持一致性,因为路由是确定性的。 SERA 不同于让 LLM 逐步决定工具和提示,而是将查询嵌入并与两个索引进行匹配:一个用于工具,一个用于提示模板。 了解这种设计如何使开源推理系统变得可预测、可测试和可扩展 🧵
Sentient
Sentient2025年12月12日
宣布 SERA-Crypto(语义嵌入与推理代理):我们为 SOTA 加密研究构建的新推理架构。 #1 开源代理在 DMind 上 #1 在我们的实时加密基准测试中 在 45 秒内超越 GPT-5、Grok 4、Gemini 2.5 Pro 和 Perplexity Finance…
2/ 可重复的规模化路由 大多数代理堆栈在运行过程中可能会漂移,因为工具选择取决于模型的中间推理。这在长时间运行时更为严重。 使用 SERA,类似的问题可靠地触发相同的工具集和相同的模板,因此随着工具、类别和流量的扩展,行为保持一致。
3/ 在SERA中,工具调用是默认的并行方式 一旦选择了路线,SERA会并行触发多个工具调用,然后对返回的数据进行单次综合处理。 这使您能够在更少的循环中获得更广泛的覆盖、更低的延迟和更少的故障模式——这正是您在推动开源推理性能时所希望的。
4/ SERA 提供了一条更清晰的生产可靠性路径 因为路由与推理是分开处理的,你可以扩展工具表面,优化模板,并在不改变整体工作流程的情况下控制延迟。 这样系统就更容易调试,运行成本更低,移植也更简单。这种架构使得 SERA 能够与重量级的封闭堆栈竞争,同时保持开源。
2.05K