Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
// Primitivas de Agente //
Esta es una perspectiva realmente interesante sobre la construcción de sistemas multi-agente efectivos.
Los sistemas multi-agente se vuelven más complejos a medida que las tareas se vuelven más difíciles. Más roles, más indicaciones, más patrones de interacción personalizados. Sin embargo, los patrones de cálculo centrales siguen repitiéndose en cada sistema: revisar, votar, planificar, ejecutar.
Pero nadie trata estos patrones como bloques de construcción reutilizables.
Esta nueva investigación introduce las Primitivas de Agente, un conjunto de bloques de construcción latentes para construir sistemas multi-agente efectivos.
Inspirados en cómo se construyen las redes neuronales a partir de componentes reutilizables como bloques residuales y cabezales de atención, los investigadores descomponen las arquitecturas multi-agente en tres primitivas recurrentes: Revisión, Votación y Selección, y Planificación y Ejecución.
¿Qué hace que estas primitivas sean diferentes? Los agentes dentro de cada primitiva se comunican a través de KV-cache en lugar de lenguaje natural. Esto evita la degradación de la información que ocurre cuando los agentes intercambian mensajes de texto largos en interacciones de múltiples etapas.
Un agente Organizador selecciona y compone primitivas para cada consulta, guiado por un ligero pool de conocimiento de configuraciones previamente exitosas.
No se requiere diseño manual del sistema.
Los resultados en ocho benchmarks que abarcan matemáticas, generación de código y QA con cinco LLMs de código abierto:
> Los MAS basados en primitivas mejoran la precisión promedio en un 12.0-16.5% en comparación con las líneas base de un solo agente.
> En GPQA-Diamond, la mejora es notable, 53.2% frente al rango de 33.6-40.2% de métodos anteriores como AgentVerse, DyLAN y MAS-GPT.
En términos de eficiencia, el uso de tokens y la latencia de inferencia disminuyen aproximadamente 3-4 veces en comparación con MAS basados en texto, mientras que solo incurren en un sobrecosto de 1.3-1.6 veces en relación con la inferencia de un solo agente.
En lugar de diseñar arquitecturas multi-agente específicas para tareas desde cero, las Primitivas de Agente muestran que un pequeño conjunto de patrones de cálculo reutilizables con comunicación latente puede igualar o superar sistemas personalizados mientras es dramáticamente más eficiente.
Artículo:
...

Parte superior
Clasificación
Favoritos
