Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Co kdyby se váš agent mohl naučit sám?
Nový výzkumný článek Sentient AI Researcher @salahalzubi401 o EvoSkill automaticky generuje vysoce kvalitní dovednosti pro Claude Code, OpenHands a další.
Zadejte jakýkoli benchmark a algoritmus podobný GEPA automaticky zvládne vaše agentky související úkoly.

11. 3. 21:44
Samorozvíjející se rámec pro objevování a zdokonalování dovedností agentů.
Většina dovedností agentů, které dnes vidím, je ručně vytvořená nebo špatně navržená agentem.
Multiagentní systémy pro budování dovedností vypadají slibně.
Tento článek představuje EvoSkill, samovyvíjející se rámec, který automaticky objevuje a zdokonaluje dovednosti agentů prostřednictvím iterativní analýzy selhání.
EvoSkill analyzuje selhání při provedení, navrhuje nové dovednosti nebo úpravy stávajících a materializuje je do strukturovaných, znovupoužitelných složek dovedností.
Celý proces řídí tři spolupracující agenti.
Executor, který spravuje úkoly, Propoř, který diagnostikuje selhání, a Skill-Builder, který vytváří konkrétní složky dovedností.
Pareto hranice řídí výběr, přičemž si zachovává pouze dovednosti, které zlepšují výkon při ověřování při oddaných testech, přičemž základní model zůstává zmrazený.
Na OfficeQA EvoSkill zlepšuje Claude Code s Opus 4.5 z 60,6 % na 67,9 % přesnosti přesné shody. Na SealQA to znamená 12,1% zisk. Dovednosti vyvinuté na SealQA přenášejí nulovou střelu do BrowseComp, což zlepšuje přesnost o 5,3 % bez úprav.
Budu tuto linii výzkumu nadále pečlivě sledovat. Myslím, že je to opravdu důležité.
Článek:
Naučte se vytvářet efektivní AI agenty v naší akademii:

@salahalzubi401 Zastupování @salahalzubi401
529
Top
Hodnocení
Oblíbené
