Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Я натрапив на спосіб покращити керування агентами. А саме — як покращити продуктивність, коли ви кажете «переконайтеся, що зробите це», а LLM цього не робить. Ось воно:
Твердження «пам'ятайте робити X» є ненадійним — це вимагає, щоб LLM спонтанно ініціював процедурну поведінку. Але надання агенту конкретного, можливо хибного твердження («Ви повинні робити X — ви все ще це робите?») надійно запускає коригувальну поведінку, коли претензія неправильна.
Агент не повинен пам'ятати перевірити. Невідповідність між представленим станом і фактичним станом створює подію корекції, на яку агент LLM природно реагує.
Це нагадує мені стару максиму «найкращий спосіб отримати правильну відповідь в інтернеті — опублікувати неправильну», і, мабуть, це логічно, адже LLM — це переважно дистильоване «знання» інтернету.
У будь-якому разі, я створював довготривалу систему пам'яті для своїх агентів, і реалізація цього способу вирішила багато проблем.
Найкращі
Рейтинг
Вибране
