DApp Store | Centrum Web3 pro události a hry

Populární témata

Samorozvíjející se rámec pro objevování a zdokonalování dovedností agentů. Většina dovedností agentů, které dnes vidím, je ručně vytvořená nebo špatně navržená agentem. Multiagentní systémy pro budování dovedností vypadají slibně. Tento článek představuje EvoSkill, samovyvíjející se rámec, který automaticky objevuje a zdokonaluje dovednosti agentů prostřednictvím iterativní analýzy selhání. EvoSkill analyzuje selhání při provedení, navrhuje nové dovednosti nebo úpravy stávajících a materializuje je do strukturovaných, znovupoužitelných složek dovedností. Celý proces řídí tři spolupracující agenti. Executor, který spravuje úkoly, Propoř, který diagnostikuje selhání, a Skill-Builder, který vytváří konkrétní složky dovedností. Pareto hranice řídí výběr, přičemž si zachovává pouze dovednosti, které zlepšují výkon při ověřování při oddaných testech, přičemž základní model zůstává zmrazený. Na OfficeQA EvoSkill zlepšuje Claude Code s Opus 4.5 z 60,6 % na 67,9 % přesnosti přesné shody. Na SealQA to znamená 12,1% zisk. Dovednosti vyvinuté na SealQA přenášejí nulovou střelu do BrowseComp, což zlepšuje přesnost o 5,3 % bez úprav. Budu tuto linii výzkumu nadále pečlivě sledovat. Myslím, že je to opravdu důležité. Článek: Naučte se vytvářet efektivní AI agenty v naší akademii:

Top

Hodnocení

Oblíbené