Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Агенти LLM виконують довгі завдання.
Саме тут контекстна інженерія справді має значення.
Агенти можуть логічно міркувати та використовувати інструменти, але тривалі операції спричиняють необмежений ріст контексту та накопичення помилок.
Поширені виправлення, такі як стиснення контексту або підказки з доповненням пошуку, змушують компроміси між достовірністю інформації та стабільністю логіки.
Це нове дослідження вводить InfiAgent — фреймворк, який суворо обмежує контекст мислення агента незалежно від тривалості завдання.
Ідея полягає в тому, щоб зовнішньо вивести стійкий стан у файлоцентричну абстракцію. Замість того, щоб втискати все в контекст, агент підтримує робочий простір файлів, які зберігаються на крізь кілька кроків. У кожній точці прийняття рішення він відновлює контекст із знімка стану робочого простору та фіксованого вікна останніх дій.
Це відокремлює тривалість завдання від розміру контексту. Незалежно від того, чи займає завдання 10 кроків, чи 1000, контекст логіки залишається незмінним.
Це приємно, бо підхід не вимагає конкретного налаштування завдань. Агент працює однаково незалежно від домену.
Експерименти на DeepResearch та завдання з огляду літератури з 80 статей показують, що InfiAgent з відкритою моделлю 20B є конкурентоспроможним із більшими пропрієтарними системами. Він підтримує значно вищий довготривалий горизонтальний покриття, ніж контекстно-орієнтовані базові лінії.
Огляд літератури з 80 статей особливо показовий. Це саме той тип тривалої роботи, де традиційні агенти накопичують помилки і втрачають відлік того, що зробили. Зовнішність стану на основі файлів у InfiAgent запобігає такому погіршенню.
Стаття:
Навчіться створювати ефективних агентів ШІ в нашій академії:

Найкращі
Рейтинг
Вибране
