Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Flott papir for agentbyggere.
Systemer med flere agenter leverer ofte for lite. Problemet er ikke hvordan agentene selv er bygget. Det er slik de er organisert.
De er for det meste bygget med faste kjeder, trær og grafer som ikke kan tilpasse seg etter hvert som oppgaver utvikler seg.
Men hva om systemet kunne lære sine egne koordinasjonsmønstre?
Denne nye forskningen introduserer Puppeteer, et rammeverk som lærer å orkestrere agenter dynamisk i stedet for å stole på håndlagde topologier.
I stedet for å forhåndsdefinere samarbeidsstrukturer, velger en orkestrator hvilken agent som skal snakke neste gang basert på den utviklende samtaletilstanden. Policyen trenes med REINFORCE, som optimaliserer direkte for oppgavesuksess.
I stedet for å lete gjennom komplekse graftopologier, serialiserer de alt i sekvensielle agentvalg. Denne omformuleringen unngår kombinatorisk kompleksitet.
Det som kommer frem er overraskende: kompakte sykliske mønstre utvikler seg naturlig. Ikke omfattende grafer, men stramme løkker der 2-3 agenter tar seg av mesteparten av arbeidet.
Det bemerkelsesverdige er at systemet oppdager effektivitet på egen hånd.
Resultater:
- På GSM-Hard matematikkoppgaver: 70 % nøyaktighet (opp fra 13,5 % for basismodellen alene).
- På MMLU-Pro: 83 % (mot 76 % baseline).
- På SRDD-programvareutvikling: 76,4 % (mot 60,6 % baseline).
Disse gevinstene kommer med redusert token-forbruk. Artikkelen viser at tokenkostnadene jevnt går ned gjennom opplæringen, samtidig som ytelsen forbedres.
De beviser også at agentutvelgelsesprosessen tilfredsstiller Markov-egenskaper, noe som betyr at den nåværende tilstanden alene bestemmer den optimale neste agenten. Det er ikke nødvendig å spore hele historikken.
Hvorfor det er viktig for AI-utviklere: lært enkelhet slår ingeniørmessig kompleksitet. En trent ruter med noen få spesialiserte agenter kan overgå avanserte håndlagde arbeidsflyter samtidig som den reduserer beregningskostnader.

Topp
Rangering
Favoritter

