一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

// 代理原语 // 这是一个关于构建有效多代理系统的非常有趣的看法。随着任务变得更加困难，多代理系统变得更加复杂。更多的角色，更多的提示，更多定制的交互模式。然而，核心计算模式在每个系统中不断重复：审查、投票、计划、执行。但没有人将这些模式视为可重用的构建块。这项新研究引入了代理原语，一组用于构建有效多代理系统的潜在构建块。受到神经网络如何由可重用组件（如残差块和注意力头）构建的启发，研究人员将多代理架构分解为三个重复出现的原语：审查、投票与选择，以及计划与执行。这些原语有什么不同？每个原语中的代理通过KV缓存进行通信，而不是自然语言。这避免了在多阶段交互中，代理之间来回传递长文本消息时发生的信息退化。一个组织者代理为每个查询选择并组合原语，受先前成功配置的轻量知识库的指导。无需手动系统设计。在涵盖数学、代码生成和QA的八个基准测试中，使用五个开源LLM的结果： > 基于原语的MAS在单代理基线之上提高了12.0-16.5%的平均准确率 > 在GPQA-Diamond上，改进显著，达到53.2%，而之前的方法如AgentVerse、DyLAN和MAS-GPT的范围为33.6-40.2% 在效率方面，令牌使用和推理延迟相比基于文本的MAS下降了大约3-4倍，而相对于单代理推理仅增加了1.3-1.6倍的开销。代理原语表明，与从头设计特定任务的多代理架构相比，一小组可重用的计算模式与潜在通信可以匹配或超越定制系统，同时显著提高效率。论文： ...