热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
// 代理原语 //
这是一个关于构建有效多代理系统的非常有趣的看法。
随着任务变得更加困难,多代理系统变得更加复杂。更多的角色,更多的提示,更多定制的交互模式。然而,核心计算模式在每个系统中不断重复:审查、投票、计划、执行。
但没有人将这些模式视为可重用的构建块。
这项新研究引入了代理原语,一组用于构建有效多代理系统的潜在构建块。
受到神经网络如何由可重用组件(如残差块和注意力头)构建的启发,研究人员将多代理架构分解为三个重复出现的原语:审查、投票与选择,以及计划与执行。
这些原语有什么不同?每个原语中的代理通过KV缓存进行通信,而不是自然语言。这避免了在多阶段交互中,代理之间来回传递长文本消息时发生的信息退化。
一个组织者代理为每个查询选择并组合原语,受先前成功配置的轻量知识库的指导。
无需手动系统设计。
在涵盖数学、代码生成和QA的八个基准测试中,使用五个开源LLM的结果:
> 基于原语的MAS在单代理基线之上提高了12.0-16.5%的平均准确率
> 在GPQA-Diamond上,改进显著,达到53.2%,而之前的方法如AgentVerse、DyLAN和MAS-GPT的范围为33.6-40.2%
在效率方面,令牌使用和推理延迟相比基于文本的MAS下降了大约3-4倍,而相对于单代理推理仅增加了1.3-1.6倍的开销。
代理原语表明,与从头设计特定任务的多代理架构相比,一小组可重用的计算模式与潜在通信可以匹配或超越定制系统,同时显著提高效率。
论文:
...

热门
排行
收藏
