НОВЕ дослідження від Meta Superintelligence Labs. Вона використовує розумну стратегічно-аукціонну структуру для покращення самовдосконалюваних агентів у складних завданнях. Маленьких агентів не завжди достатньо. У найпростіших завданнях агент параметрів 4B досягає 87% продуктивності агента 32B. Але на найскладніших завданнях ця відносна продуктивність падає до лише 21%. За замовчуванням сьогодні припущення — або використовувати найбільшу модель для всього, або маршрутизувати завдання за допомогою навченого класифікатора. Але навчені маршрутизатори погіршуються зі зростанням складності завдань, а непередбачувані каскади стають надто дорогими для агентних робочих навантажень. Це нове дослідження представляє SALE (Strategy Auctions for Workload Efficiency) — фреймворк, натхненний фрілансерськими маркетплейсами. Замість того, щоб прогнозувати, яку модель використовувати лише за описом завдання, агенти пропонують короткі стратегічні плани, які оцінюються систематичним механізмом витрат і вартості. Як працює аукціон? Кожен кандидат-агент пропонує стратегічний план рішення. Колеги-журі оцінює плани за прогнозованою вартістю. Евристичний прогнозатор витрат оцінює вартість виконання. Агент із найкращим співвідношенням витрат і вартості перемагає і виконує свій план. Саме механізм самовдосконалення стає цікавим. Після кожного аукціону всі запропоновані стратегії зберігаються у спільній пам'яті. Дешевші агенти, які програли, можуть вчитися на виграшних стратегіях і подавати вдосконалені пропозиції, подібно до підвищення кваліфікації фрілансерів з часом. У завданнях з глибоким пошуком SALE перевищує pass@1 найкращого окремого агента на 3,5 пункти, знижуючи витрати на 35%. У програмних завданнях він покращує pass@1 на 2,7 пункти при 25% нижчій вартості. У обох сферах SALE зменшує залежність від найбільшого агента на 53%. Існуючі маршрутизатори, такі як WTP і FrugalGPT, або відстають від найбільшого агента, або не знижують витрати. Витрати FrugalGPT фактично зростають на складні завдання з кодування, досягаючи 0,61 долара за мільйон токенів проти 0,36 доларів у найкращого агента. Ринкові механізми координації, які організовують гетерогенних агентів у адаптивні екосистеми, можуть систематично перевершувати як окремі великі моделі, так і навчені підходи до маршрутизації. Стаття: Навчіться створювати ефективних AI-агентів у нашій академії: