Jag har snubblat över ett sätt att förbättra agentstyrning. Nämligen hur man förbättrar prestandan när man säger "se till att du gör detta" och LLM:n inte gör det. Här är den: Att säga "kom ihåg att göra X" är opålitligt – det kräver att LLM:n agenten spontant initierar ett procedurbeteende. Men att presentera agenten för ett specifikt, möjligen felaktigt påstående ("Du borde göra X – gör du det fortfarande?") utlöser pålitligt korrigerande beteende när påståendet är fel. Agenten behöver inte komma ihåg att kolla. Mismatchen mellan presenterat tillstånd och faktiskt tillstånd skapar en korrigeringshändelse som agentens LLM naturligt reagerar på. Detta påminner mig om det gamla talesättet "det bästa sättet att få ett korrekt svar på internet är att posta ett felaktigt" och jag antar att det är logiskt eftersom LLM:er till största delen är internets destillerade "kunskap". Hur som helst har jag byggt ett långvarigt minnessystem för mina agenter och implementerat det på det sättet löste många problem.