Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Un cadru auto-evolutiv pentru a descoperi și rafina abilitățile agenților.
Majoritatea abilităților de agent pe care le văd astăzi sunt făcute manual sau prost concepute de un agent.
Sistemele multi-agent pentru dezvoltarea abilităților par promițătoare.
Această lucrare introduce EvoSkill, un cadru auto-evolutiv care descoperă și rafinează automat abilitățile agenților prin analiza iterativă a defectelor.
EvoSkill analizează eșecurile de execuție, propune abilități noi sau editări la cele existente și le materializează în foldere structurate și reutilizabile pentru abilități.
Trei agenți colaboratori conduc întregul proces.
Un Executor care rulează sarcini, un Proponer care diagnostichează eșecurile și un Skill-Builder care creează foldere concrete de abilități.
O frontieră Pareto guvernează selecția, păstrând doar abilități care îmbunătățesc performanța validării reținute, păstrând în același timp modelul de bază blocat.
Pe OfficeQA, EvoSkill îmbunătățește Claude Code cu Opus 4.5 de la 60,6% la 67,9% acuratețe exactă a potrivirii. Pe SealQA, se obține un câștig de 12,1%. Abilitățile evoluate pe SealQA transferă zero-shot către BrowseComp, îmbunătățind acuratețea cu 5,3% fără modificări.
Voi continua să urmăresc îndeaproape această linie de cercetare. Cred că este foarte important.
Hârtie:
Învață să construiești agenți AI eficienți în academia noastră:

Limită superioară
Clasament
Favorite
