Ce-ar fi dacă agentul tău ar putea să se învețe singur? Noul articol de cercetare al cercetătorului AI Sentient @salahalzubi401 despre EvoSkill generează automat abilități de înaltă calitate pentru Claude Code, OpenHands și altele. Adăugați orice benchmark și algoritmul asemănător GEPA face ca agentul dumneavoastră să fie automat priceput la sarcinile asociate.
elvis
elvis11 mar., 21:44
Un cadru auto-evolutiv pentru a descoperi și rafina abilitățile agenților. Majoritatea abilităților de agent pe care le văd astăzi sunt făcute manual sau prost concepute de un agent. Sistemele multi-agent pentru dezvoltarea abilităților par promițătoare. Această lucrare introduce EvoSkill, un cadru auto-evolutiv care descoperă și rafinează automat abilitățile agenților prin analiza iterativă a defectelor. EvoSkill analizează eșecurile de execuție, propune abilități noi sau editări la cele existente și le materializează în foldere structurate și reutilizabile pentru abilități. Trei agenți colaboratori conduc întregul proces. Un Executor care rulează sarcini, un Proponer care diagnostichează eșecurile și un Skill-Builder care creează foldere concrete de abilități. O frontieră Pareto guvernează selecția, păstrând doar abilități care îmbunătățesc performanța validării reținute, păstrând în același timp modelul de bază blocat. Pe OfficeQA, EvoSkill îmbunătățește Claude Code cu Opus 4.5 de la 60,6% la 67,9% acuratețe exactă a potrivirii. Pe SealQA, se obține un câștig de 12,1%. Abilitățile evoluate pe SealQA transferă zero-shot către BrowseComp, îmbunătățind acuratețea cu 5,3% fără modificări. Voi continua să urmăresc îndeaproape această linie de cercetare. Cred că este foarte important. Hârtie: Învață să construiești agenți AI eficienți în academia noastră:
@salahalzubi401 Reprezentarea @salahalzubi401
539