もしエージェントが独学で学べたらどうでしょう? Sentient AI Researcher @salahalzubi401の新しい研究論文「EvoSkill」は、Claude Code、OpenHandsなど向けに高品質なスキルを自動的に生成します。 任意のベンチマークを挿入すれば、GEPAのようなアルゴリズムによりエージェントは関連するタスクを自動的に熟練します。
elvis
elvis3月11日 21:44
エージェントのスキルを発見し磨くための自己進化するフレームワーク。 今日私が見るエージェントのスキルの多くは、手作りか、エージェントによって設計が不十分なものです。 スキル構築のためのマルチエージェントシステムは有望に見えます。 本論文では、反復的な故障解析を通じてエージェントのスキルを自動的に発見・洗練させる自己進化型フレームワークEvoSkillを紹介します。 EvoSkillは実行失敗を分析し、新しいスキルや既存スキルへの修正を提案し、それらを構造化され再利用可能なスキルフォルダに具現化します。 3人の協力エージェントが全体のプロセスを主導します。 タスクを実行するエグゼキューター、失敗を診断するプロポーザー、そして具体的なスキルフォルダを作成するスキルビルダーです。 パレートフロンティアは選択を支配し、保留された検証性能を向上させるスキルのみを保持しつつ、基礎モデルは凍結します。 OfficeQAでは、EvoSkillがOpus 4.5のClaude Codeの正確マッチ精度を60.6%から67.9%に向上させています。SealQAでは12.1%の利得が得られます。SealQAで進化したスキルはゼロショットでBrowseCompに移行し、修正なしで命中率を5.3%向上させました。 この研究の流れを引き続き注意深く追い続けます。本当に大事だと思います。 論文: 私たちのアカデミーで効果的なAIエージェントの構築方法を学びましょう:
@salahalzubi401 @salahalzubi401 代表
542