Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Крутий папір для агентів-будівельників.
Мультиагентні системи часто працюють недооцінюче. Проблема не в тому, як самі агенти побудовані. Так вони організовані.
Вони здебільшого побудовані з фіксованих ланцюгів, дерев і графіків, які не можуть адаптуватися в міру розвитку завдань.
Але що, якби система могла засвоїти власні патерни координації?
Це нове дослідження представляє Puppeteer — фреймворк, який навчається динамічно координувати агентів, а не покладатися на ручну топологію.
Замість того, щоб заздалегідь визначити структури співпраці, оркестратор обирає, який агент заговорить наступним, виходячи з розвитку стану розмови. Політика навчена за допомогою REINFORCE, оптимізуючи її безпосередньо для успіху завдання.
Замість того, щоб шукати по складних графових топологіях, вони серіалізують усе у послідовні вибори агентів. Це переосмислення обходить комбінаторну складність.
Те, що з'являється дивовижно: компактні циклічні візерунки розвиваються природно. Не розкидані графіки, а чіткі цикли, де 2-3 агенти виконують більшість роботи.
Вражає те, що система сама по собі знаходить ефективність.
Результатів:
- На задачах GSM-Hard математики: точність 70% (порівняно з 13,5% лише для базової моделі).
- На MMLU-Pro: 83% (проти 76% базового рівня).
- Щодо розробки програмного забезпечення SRDD: 76,4% (проти 60,6% базового рівня).
Ці прибутки приходять зі зниженням споживання токенів. У статті показано, що витрати на жетони постійно знижуються протягом навчання, а продуктивність покращується.
Вони також доводять, що процес вибору агента задовольняє властивості Маркова, тобто лише поточний стан визначає оптимального наступного агента. Немає потреби відстежувати повну історію.
Чому це важливо для розробників ШІ: засвоєна простота переважає інженерну складність. Навчений маршрутизатор із кількома спеціалізованими агентами може перевершити складні ручні робочі процеси, зменшуючи обчислювальні витрати.

Найкращі
Рейтинг
Вибране

