Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
I sistemi multi-agente (Multi-agent systems) deludono spesso?
Il problema potrebbe non risiedere negli agenti stessi, ma nel modo in cui sono organizzati.
La maggior parte dei sistemi adotta strutture fisse a catena, ad albero o a grafo, che non possono adattarsi ai cambiamenti dei compiti.
Ma se il sistema potesse apprendere i propri modelli di collaborazione?
Questo importante articolo presenta un framework chiamato Puppeteer, che può orchestrare dinamicamente gli agenti, invece di fare affidamento su strutture topologiche pre-progettate.
La chiave è:
• Non più strutture di collaborazione predefinite, ma un coordinatore che seleziona il prossimo agente che parla in base allo stato del dialogo in continua evoluzione.
• Utilizzare l'algoritmo REINFORCE per addestrare la strategia, ottimizzando direttamente il tasso di successo del compito.
• Serializzare tutto in scelte continue di agenti, evitando la complessità combinatoria, invece di cercare in topologie grafiche complesse.
I risultati sono sorprendenti:
Si formano naturalmente modelli ciclici compatti, piuttosto che strutture grafiche enormi, in cui 2-3 agenti gestiscono la maggior parte del lavoro.
Ancora più impressionante, il sistema è in grado di scoprire autonomamente l'efficienza.
Risultati mostrati:
• Su problemi matematici GSM-Hard: tasso di precisione del 70% (rispetto al 13,5% quando si utilizza il modello di base da solo).
• Su MMLU-Pro: raggiunto l'83% (baseline del 76%).
• Sviluppo software SRDD: raggiunto il 76,4% (baseline del 60,6%).
Questi miglioramenti sono accompagnati da una riduzione del consumo di token.
L'articolo dimostra che, durante l'intero processo di addestramento, il costo dei token continua a diminuire mentre le prestazioni aumentano.
Hanno anche dimostrato che il processo di selezione degli agenti soddisfa la proprietà di Markov, il che significa che lo stato attuale può determinare il miglior prossimo agente, senza la necessità di tenere traccia della storia completa.
Quindi:
Per gli sviluppatori di AI, la semplicità appresa supera la complessità progettata con cura.
Un router addestrato, insieme ad alcuni agenti specializzati, può superare flussi di lavoro progettati con cura, riducendo al contempo il carico computazionale.

Link al documento:
1,7K
Principali
Ranking
Preferiti

