DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

Sistemas multiagente frequentemente decepcionam? O problema pode não estar nos próprios agentes, mas na forma como eles são organizados. A maioria dos sistemas possui uma estrutura fixa de cadeia, árvore ou grafo que não pode ser ajustada conforme a tarefa muda. Mas e se o sistema puder aprender seu próprio modelo de colaboração? Este artigo de grande sucesso introduz um framework chamado Puppeteer, que orquestra agentes de forma dinâmica em vez de depender de topologias pré-projetadas. O ponto chave é: • Não mais estruturas de colaboração predefinidas, mas agentes cujos coordenadores escolhem o próximo palestrante com base em mudanças nos estados da conversa. • Treinar estratégias usando algoritmos REINFORCE para otimizar diretamente as taxas de sucesso das tarefas. • Evitar a complexidade combinatória serializando tudo em uma seleção contínua de agentes, em vez de buscar topologias complexas de grafos. Os resultados são surpreendentes: Em vez de uma estrutura de grafo enorme, forma-se naturalmente um padrão cíclico compacto, no qual 2-3 agentes realizam a maior parte do trabalho. O que é ainda mais poderoso é que o sistema pode descobrir a eficiência de forma autonônoma. Exibição de Conquistas: • Em problemas de matemática GSM-Hard: 70% de precisão (comparado a 13,5% quando o modelo de fundação é usado sozinho). • Com MMLU-Pro: atingiu 83% (76% no início). • No desenvolvimento de software SRDD: alcançou 76,4% (linha de base de 60,6%). Esses aumentos vêm acompanhados de uma diminuição no consumo de tokens. O artigo mostra que os custos das fichas continuam a diminuir enquanto o desempenho melhora ao longo do treinamento. Eles também demonstraram que o processo de seleção do agente satisfaz a propriedade de Markov, ou seja, que o estado atual determina o próximo agente ótimo sem a necessidade de acompanhar todo o histórico. Então: Para desenvolvedores de IA, a simplicidade do aprendizado supera a complexidade de um design cuidadoso. Um roteador treinado com alguns agentes especializados supera fluxos de trabalho bem projetados, reduzindo a sobrecarga computacional.

Link do artigo:

1,71K

Melhores

Classificação

Favoritos