Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
¿Los sistemas multiagente suelen decepcionar?
El problema puede no estar en los propios agentes, sino en cómo están organizados.
La mayoría de los sistemas tienen una estructura fija de cadena, árbol o grafo que no puede ajustarse a medida que cambia la tarea.
Pero, ¿y si el sistema puede aprender su propio modelo de colaboración?
Este artículo de gran éxito introduce un marco llamado Puppeteer, que orquesta dinámicamente a los agentes en lugar de depender de topologías prediseñadas.
La clave es:
• Ya no estructuras de colaboración predefinidas, sino agentes cuyos coordinadores eligen al siguiente ponente en función de los cambios en los estados de la conversación.
• Entrenar estrategias utilizando algoritmos REINFORCE para optimizar directamente las tasas de éxito de las tareas.
• Evitar la complejidad combinatoria serializando todo en una selección continua de agentes en lugar de buscar topologías complejas de grafos.
Los resultados son sorprendentes:
En lugar de una estructura de grafo enorme, se forma naturalmente un patrón cíclico compacto, en el que 2-3 agentes manejan la mayor parte del trabajo.
Lo que es aún más potente es que el sistema puede descubrir la eficiencia de forma autónoma.
Exhibición de logros:
• En problemas de matemáticas GSM-Hard: 70% de precisión (comparado con el 13,5% cuando se usa solo el modelo de base).
• Con MMLU-Pro: alcanzó un 83% (76% al inicio).
• En desarrollo de software SRDD: alcanzó un 76,4% (línea base del 60,6%).
Estos impulsos van acompañados de una disminución en el consumo de tokens.
El artículo muestra que los costes de los tokens siguen disminuyendo mientras el rendimiento mejora a lo largo del entrenamiento.
También demostraron que el proceso de selección de agentes satisface la propiedad de Markov, lo que significa que el estado actual determina el siguiente agente óptimo sin necesidad de seguir todo el historial.
Así que:
Para los desarrolladores de IA, la simplicidad del aprendizaje supera la complejidad de un diseño cuidadoso.
Un router entrenado con algunos agentes especializados supera flujos de trabajo bien diseñados mientras reduce la sobrecarga computacional.

Enlace al artículo:
1.7K
Populares
Ranking
Favoritas

