Я наткнулся на способ улучшить управление агентами. А именно, как улучшить производительность, когда вы говорите "убедитесь, что вы это сделали", а LLM этого не делает. Вот как: Сказать "не забудьте сделать X" ненадежно - это требует от агента LLM спонтанного инициирования процедурного поведения. Но представление агенту конкретного, возможно, неверного утверждения ("Вы должны делать X - вы все еще это делаете?") надежно вызывает корректирующее поведение, когда утверждение неверно. Агенту не нужно помнить о проверке. Несоответствие между представленным состоянием и фактическим состоянием создает событие коррекции, на которое агент LLM естественно реагирует. Это напоминает мне старую пословицу "лучший способ получить правильный ответ в интернете - это опубликовать неправильный" и, думаю, это имеет смысл, поскольку LLM в основном является дистиллированным "знанием" интернета. В любом случае, я строил систему долговременной памяти для моих агентов, и реализация этого способа исправила много проблем.