Entä jos agenttisi voisi opettaa itse? Sentient AI Researcher @salahalzubi401:n uusi EvoSkill-tutkimuspaperi tuottaa automaattisesti korkealaatuisia taitoja Claude Codelle, OpenHandsille ja muille. Syötä mikä tahansa testitesti, ja GEPA-tyyppinen algoritmi tekee agentistasi automaattisesti taitavan niihin liittyvissä tehtävissä.
elvis
elvis11.3. klo 21.44
Itsekehittyvä kehys agenttitaitojen löytämiseen ja hiomiseen. Suurin osa agenttitaidoista, joita näen nykyään, on käsityönä tehty tai huonosti agentin suunnittelemia. Moniagenttijärjestelmät taitojen kehittämiseen vaikuttavat lupaavilta. Tässä artikkelissa esitellään EvoSkill, itsekehittyvä viitekehys, joka automaattisesti löytää ja kehittää agentin taitoja iteratiivisen vika-analyysin avulla. EvoSkill analysoi suoritusvirheitä, ehdottaa uusia taitoja tai muokkauksia olemassa oleviin ja materialisoi ne rakenteellisiksi, uudelleenkäytettäviksi taitokansioiksi. Kolme yhteistyötä tekevää agenttia ohjaa koko prosessia. Executor, joka suorittaa tehtäviä, Proposer, joka diagnosoi epäonnistumiset, ja Skill-Builder, joka luo konkreettisia taitokansioita. Pareto-rajamaa ohjaa valintaa, säilyttäen vain taidot, jotka parantavat pidettyä validointisuorituskykyä samalla kun taustalla oleva malli pysyy jäädytettynä. OfficeQA:ssa EvoSkill parantaa Claude Code -kurssin Opus 4.5:n tarkkuutta 60,6 %:sta 67,9 %:iin täsmättömyyden tarkkuudella. SealQA:ssa se tuottaa 12,1 %:n nousun. SealQA:ssa kehittyneet taidot siirtyvät nollalaukauksella BrowseCompiin, parantaen tarkkuutta 5,3 % ilman muutoksia. Jatkan tämän tutkimuslinjan tarkkaa seuraamista. Mielestäni se on todella tärkeää. Artikkeli: Opettele rakentamaan tehokkaita tekoälyagentteja akatemiassamme:
@salahalzubi401 Edustaa @salahalzubi401
541