Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Un cadre auto-évolutif pour découvrir et affiner les compétences des agents.
La plupart des compétences des agents que je vois aujourd'hui sont fabriquées à la main ou mal conçues par un agent.
Les systèmes multi-agents pour construire des compétences semblent prometteurs.
Cet article présente EvoSkill, un cadre auto-évolutif qui découvre et affine automatiquement les compétences des agents grâce à une analyse itérative des échecs.
EvoSkill analyse les échecs d'exécution, propose de nouvelles compétences ou des modifications à celles existantes, et les matérialise en dossiers de compétences structurés et réutilisables.
Trois agents collaborants pilotent l'ensemble du processus.
Un Exécuteur qui exécute des tâches, un Proposeur qui diagnostique les échecs, et un Constructeur de Compétences qui crée des dossiers de compétences concrets.
Une frontière de Pareto régit la sélection, ne retenant que les compétences qui améliorent la performance de validation retenue tout en gardant le modèle sous-jacent figé.
Sur OfficeQA, EvoSkill améliore Claude Code avec Opus 4.5 de 60,6 % à 67,9 % de précision d'exactitude. Sur SealQA, il génère un gain de 12,1 %. Les compétences évoluées sur SealQA se transfèrent en zéro-shot à BrowseComp, améliorant la précision de 5,3 % sans modification.
Je vais continuer à suivre cette ligne de recherche de près. Je pense que c'est vraiment important.
Article :
Apprenez à construire des agents IA efficaces dans notre académie :

Meilleurs
Classement
Favoris
