Я натрапив на спосіб покращити керування агентами. А саме — як покращити продуктивність, коли ви кажете «переконайтеся, що зробите це», а LLM цього не робить. Ось воно: Твердження «пам'ятайте робити X» є ненадійним — це вимагає, щоб LLM спонтанно ініціював процедурну поведінку. Але надання агенту конкретного, можливо хибного твердження («Ви повинні робити X — ви все ще це робите?») надійно запускає коригувальну поведінку, коли претензія неправильна. Агент не повинен пам'ятати перевірити. Невідповідність між представленим станом і фактичним станом створює подію корекції, на яку агент LLM природно реагує. Це нагадує мені стару максиму «найкращий спосіб отримати правильну відповідь в інтернеті — опублікувати неправильну», і, мабуть, це логічно, адже LLM — це переважно дистильоване «знання» інтернету. У будь-якому разі, я створював довготривалу систему пам'яті для своїх агентів, і реалізація цього способу вирішила багато проблем.