// Primitives d'Agent // C'est une approche vraiment intéressante pour construire des systèmes multi-agents efficaces. Les systèmes multi-agents deviennent plus complexes à mesure que les tâches deviennent plus difficiles. Plus de rôles, plus de prompts, plus de modèles d'interaction sur mesure. Cependant, les modèles de calcul de base continuent de se répéter dans chaque système : révision, vote, planification, exécution. Mais personne ne traite ces modèles comme des blocs de construction réutilisables. Cette nouvelle recherche introduit les Primitives d'Agent, un ensemble de blocs de construction latents pour construire des systèmes multi-agents efficaces. Inspirés par la façon dont les réseaux neuronaux sont construits à partir de composants réutilisables comme les blocs résiduels et les têtes d'attention, les chercheurs décomposent les architectures multi-agents en trois primitives récurrentes : Révision, Vote et Sélection, et Planification et Exécution. Qu'est-ce qui rend ces primitives différentes ? Les agents à l'intérieur de chaque primitive communiquent via un cache KV plutôt que par langage naturel. Cela évite la dégradation de l'information qui se produit lorsque les agents échangent de longs messages textuels lors d'interactions multi-étapes. Un agent Organisateur sélectionne et compose des primitives pour chaque requête, guidé par un pool de connaissances léger de configurations précédemment réussies. Aucune conception manuelle du système requise. Les résultats sur huit benchmarks couvrant les mathématiques, la génération de code et les QA avec cinq LLM open-source : > Les MAS basés sur des primitives améliorent la précision moyenne de 12,0 à 16,5 % par rapport aux bases de référence à agent unique. > Sur GPQA-Diamond, l'amélioration est frappante, 53,2 % contre la plage de 33,6 à 40,2 % des méthodes précédentes comme AgentVerse, DyLAN et MAS-GPT. En termes d'efficacité, l'utilisation des tokens et la latence d'inférence chutent d'environ 3 à 4 fois par rapport aux MAS basés sur du texte, tout en entraînant seulement un surcoût de 1,3 à 1,6 fois par rapport à l'inférence à agent unique. Au lieu de concevoir des architectures multi-agents spécifiques à une tâche à partir de zéro, les Primitives d'Agent montrent qu'un petit ensemble de modèles de calcul réutilisables avec communication latente peut égaler ou dépasser des systèmes personnalisés tout en étant considérablement plus efficaces. Article : ...