Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Самоеволюційна структура для виявлення та вдосконалення навичок агентів.
Більшість навичок агента, які я бачу сьогодні, створені вручну або погано розроблені агентом.
Мультиагентні системи для розвитку навичок виглядають перспективно.
У цій статті представлено EvoSkill — самоеволюційний фреймворк, який автоматично відкриває та вдосконалює навички агентів через ітеративний аналіз невдач.
EvoSkill аналізує помилки виконання, пропонує нові навички або редагує існуючі та матеріалізує їх у структуровані, багаторазові папки навичок.
Троє співпрацюючих агентів керують усім процесом.
Виконавець, який виконує завдання, Пропозер, який діагностує невдачі, та Конструктор навичок, який створює конкретні папки навичок.
Парето-рубеж керує відбором, зберігаючи лише навички, які покращують відкладені результати валідації, залишаючи при цьому замороженою базову модель.
В OfficeQA EvoSkill покращує точність Claude Code з Opus 4.5 з 60,6% до 67,9%. На SealQA це дає приріст у 12,1%. Навички, що розвивалися на SealQA, переносить zero-shot у BrowseComp, покращуючи точність на 5,3% без змін.
Я й надалі уважно відстежуватиму цей напрямок досліджень. Я вважаю, що це дуже важливо.
Стаття:
Навчіться створювати ефективних агентів ШІ в нашій академії:

Найкращі
Рейтинг
Вибране
