E se il tuo agente potesse auto-insegnarsi? Il nuovo articolo di ricerca del ricercatore di AI senziente @salahalzubi401 su EvoSkill genera automaticamente abilità di alta qualità per Claude Code, OpenHands e altro ancora. Collega qualsiasi benchmark e l'algoritmo simile a GEPA rende il tuo agente competente nei compiti associati automaticamente.
elvis
elvis11 mar, 21:44
Un framework auto-evolutivo per scoprire e affinare le abilità degli agenti. La maggior parte delle abilità degli agenti che vedo oggi sono create a mano o mal progettate da un agente. I sistemi multi-agente per costruire abilità sembrano promettenti. Questo documento introduce EvoSkill, un framework auto-evolutivo che scopre e affina automaticamente le abilità degli agenti attraverso un'analisi iterativa dei fallimenti. EvoSkill analizza i fallimenti di esecuzione, propone nuove abilità o modifiche a quelle esistenti e le materializza in cartelle di abilità strutturate e riutilizzabili. Tre agenti collaboranti guidano l'intero processo. Un Esecutore che esegue compiti, un Propositore che diagnostica i fallimenti e un Costruttore di Abilità che crea cartelle di abilità concrete. Una frontiera di Pareto governa la selezione, mantenendo solo le abilità che migliorano le prestazioni di validazione mantenute, mentre il modello sottostante rimane congelato. Su OfficeQA, EvoSkill migliora Claude Code con Opus 4.5 dal 60.6% al 67.9% di accuratezza esatta. Su SealQA, produce un guadagno del 12.1%. Le abilità evolute su SealQA si trasferiscono zero-shot a BrowseComp, migliorando l'accuratezza del 5.3% senza modifiche. Continuerò a seguire da vicino questa linea di ricerca. Penso sia davvero importante. Documento: Impara a costruire agenti AI efficaci nella nostra accademia:
@salahalzubi401 Rappresentando @salahalzubi401
532