Jeg har snublet over en måte å forbedre agentstyring på. Nemlig hvordan man kan forbedre ytelsen når man sier «sørg for at du gjør dette» og LLM-en ikke gjør det. Her er den: Å si «husk å gjøre X» er upålitelig – det krever at LLM-agenten spontant initierer en prosedyrehandling. Men å presentere agenten for en spesifikk, muligens feil påstand ("Du burde gjøre X – gjør du det fortsatt?") utløser pålitelig korrigerende atferd når påstanden er feil. Agenten trenger ikke å huske å sjekke. Misforholdet mellom presentert tilstand og faktisk tilstand skaper en korrigeringshendelse som agentens LLM naturlig responderer på. Dette minner meg om det gamle ordtaket om «den beste måten å få et riktig svar på internett er å poste et feil», og jeg antar det gir mening siden LLM-er hovedsakelig er den destillerte «kunnskapen» på internett. Uansett, jeg har bygget et langvarig minnesystem for agentene mine, og å implementere det på denne måten løste mange problemer.