Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Skvělý papír pro agenty, kteří staví práci.
Systémy s více agenty často nedostatečně dodávají výkon. Problém není v tom, jak jsou agenti sami postaveni. Je to o tom, jak jsou organizované.
Většinou jsou postaveny na pevných řetězcích, stromech a grafech, které se nemohou přizpůsobovat vývoji úkolů.
Ale co kdyby se systém naučil své vlastní koordinační vzorce?
Tento nový výzkum představuje Puppeteer, rámec, který se učí dynamicky řídit agenty místo spoléhání se na ručně vyráběné topologie.
Místo předdefinovaných struktur spolupráce orchestrátor vybírá, který agent bude mluvit jako další na základě vyvíjejícího se stavu konverzace. Politika je trénována pomocí REINFORCE, která přímo optimalizuje úspěch úkolu.
Místo vyhledávání složitých topologií grafů serializují vše do sekvenčních výběrů agentů. Toto přeformulování obchází kombinatorickou složitost.
Objevuje se překvapení: kompaktní cyklické vzorce se vyvíjejí přirozeně. Ne rozlehlé grafy, ale těsné smyčky, kde většinu práce zvládnou 2-3 agenti.
Pozoruhodné je, že systém sám objevuje efektivitu.
Výsledky:
- U GSM-Hard matematických úloh: přesnost 70 % (nárůst z 13,5 % pouze u základního modelu).
- Na MMLU-Pro: 83 % (vs 76 % na základní úrovni).
- U vývoje softwaru SRDD: 76,4 % (oproti 60,6 % na základním stavu).
Tyto zisky přicházejí s nižší spotřebou tokenů. Článek ukazuje, že náklady na tokeny během tréninku konzistentně klesají, zatímco výkon se zlepšuje.
Také dokazují, že proces výběru agenta splňuje Markovovy vlastnosti, což znamená, že samotný aktuální stav určuje optimálního dalšího agenta. Není třeba sledovat celou historii.
Proč je to důležité pro AI vývojáře: naučená jednoduchost překonává inženýrskou složitost. Vyškolený router s několika specializovanými agenty dokáže překonat složité ručně vyráběné pracovní postupy a zároveň snížit výpočetní zátěž.

Top
Hodnocení
Oblíbené

