// 代理原语 // 这是一个关于构建有效多代理系统的非常有趣的看法。 随着任务变得更加困难,多代理系统变得更加复杂。更多的角色,更多的提示,更多定制的交互模式。然而,核心计算模式在每个系统中不断重复:审查、投票、计划、执行。 但没有人将这些模式视为可重用的构建块。 这项新研究引入了代理原语,一组用于构建有效多代理系统的潜在构建块。 受到神经网络如何由可重用组件(如残差块和注意力头)构建的启发,研究人员将多代理架构分解为三个重复出现的原语:审查、投票与选择,以及计划与执行。 这些原语有什么不同?每个原语中的代理通过KV缓存进行通信,而不是自然语言。这避免了在多阶段交互中,代理之间来回传递长文本消息时发生的信息退化。 一个组织者代理为每个查询选择并组合原语,受先前成功配置的轻量知识库的指导。 无需手动系统设计。 在涵盖数学、代码生成和QA的八个基准测试中,使用五个开源LLM的结果: > 基于原语的MAS在单代理基线之上提高了12.0-16.5%的平均准确率 > 在GPQA-Diamond上,改进显著,达到53.2%,而之前的方法如AgentVerse、DyLAN和MAS-GPT的范围为33.6-40.2% 在效率方面,令牌使用和推理延迟相比基于文本的MAS下降了大约3-4倍,而相对于单代理推理仅增加了1.3-1.6倍的开销。 代理原语表明,与从头设计特定任务的多代理架构相比,一小组可重用的计算模式与潜在通信可以匹配或超越定制系统,同时显著提高效率。 论文: ...