// Primitivas de Agente // Esta é uma abordagem realmente interessante para construir sistemas multi-agente eficazes. Os sistemas multi-agente tornam-se mais complexos à medida que as tarefas se tornam mais difíceis. Mais papéis, mais prompts, mais padrões de interação personalizados. No entanto, os padrões de computação fundamentais continuam a se repetir em todos os sistemas: rever, votar, planejar, executar. Mas ninguém trata esses padrões como blocos de construção reutilizáveis. Esta nova pesquisa introduz as Primitivas de Agente, um conjunto de blocos de construção latentes para a construção de sistemas multi-agente eficazes. Inspirados em como as redes neurais são construídas a partir de componentes reutilizáveis, como blocos residuais e cabeçotes de atenção, os pesquisadores decompõem as arquiteturas multi-agente em três primitivos recorrentes: Revisão, Votação e Seleção, e Planejamento e Execução. O que torna esses primitivos diferentes? Os agentes dentro de cada primitivo comunicam-se via KV-cache em vez de linguagem natural. Isso evita a degradação da informação que ocorre quando os agentes trocam longas mensagens de texto em interações de múltiplas etapas. Um agente Organizador seleciona e compõe primitivos para cada consulta, guiado por um pool de conhecimento leve de configurações previamente bem-sucedidas. Nenhum design de sistema manual é necessário. Os resultados em oito benchmarks que abrangem matemática, geração de código e QA com cinco LLMs de código aberto: > Sistemas multi-agente baseados em primitivos melhoram a precisão média em 12,0-16,5% em relação a bases de referência de agente único > No GPQA-Diamond, a melhoria é impressionante, 53,2% contra a faixa de 33,6-40,2% de métodos anteriores como AgentVerse, DyLAN e MAS-GPT Em termos de eficiência, o uso de tokens e a latência de inferência caem aproximadamente 3-4x em comparação com MAS baseado em texto, enquanto incorrendo apenas em 1,3-1,6x de sobrecarga em relação à inferência de agente único. Em vez de projetar arquiteturas multi-agente específicas para tarefas do zero, as Primitivas de Agente mostram que um pequeno conjunto de padrões de computação reutilizáveis com comunicação latente pode igualar ou superar sistemas personalizados, enquanto é dramaticamente mais eficiente. Artigo: ...