Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
НОВЕ дослідження від Meta Superintelligence Labs.
Вона використовує розумну стратегічно-аукціонну структуру для покращення самовдосконалюваних агентів у складних завданнях.
Маленьких агентів не завжди достатньо.
У найпростіших завданнях агент параметрів 4B досягає 87% продуктивності агента 32B. Але на найскладніших завданнях ця відносна продуктивність падає до лише 21%.
За замовчуванням сьогодні припущення — або використовувати найбільшу модель для всього, або маршрутизувати завдання за допомогою навченого класифікатора.
Але навчені маршрутизатори погіршуються зі зростанням складності завдань, а непередбачувані каскади стають надто дорогими для агентних робочих навантажень.
Це нове дослідження представляє SALE (Strategy Auctions for Workload Efficiency) — фреймворк, натхненний фрілансерськими маркетплейсами. Замість того, щоб прогнозувати, яку модель використовувати лише за описом завдання, агенти пропонують короткі стратегічні плани, які оцінюються систематичним механізмом витрат і вартості.
Як працює аукціон? Кожен кандидат-агент пропонує стратегічний план рішення. Колеги-журі оцінює плани за прогнозованою вартістю. Евристичний прогнозатор витрат оцінює вартість виконання. Агент із найкращим співвідношенням витрат і вартості перемагає і виконує свій план.
Саме механізм самовдосконалення стає цікавим. Після кожного аукціону всі запропоновані стратегії зберігаються у спільній пам'яті. Дешевші агенти, які програли, можуть вчитися на виграшних стратегіях і подавати вдосконалені пропозиції, подібно до підвищення кваліфікації фрілансерів з часом.
У завданнях з глибоким пошуком SALE перевищує pass@1 найкращого окремого агента на 3,5 пункти, знижуючи витрати на 35%. У програмних завданнях він покращує pass@1 на 2,7 пункти при 25% нижчій вартості. У обох сферах SALE зменшує залежність від найбільшого агента на 53%.
Існуючі маршрутизатори, такі як WTP і FrugalGPT, або відстають від найбільшого агента, або не знижують витрати. Витрати FrugalGPT фактично зростають на складні завдання з кодування, досягаючи 0,61 долара за мільйон токенів проти 0,36 доларів у найкращого агента.
Ринкові механізми координації, які організовують гетерогенних агентів у адаптивні екосистеми, можуть систематично перевершувати як окремі великі моделі, так і навчені підходи до маршрутизації.
Стаття:
Навчіться створювати ефективних AI-агентів у нашій академії:

Найкращі
Рейтинг
Вибране
