Am dat peste o metodă de a îmbunătăți direcția agenților. Mai exact, cum să îmbunătățești performanța când spui "asigură-te că faci asta" și LLM-ul nu o face. Iată-l: A spune "amintește-ți să faci X" este nesigur – necesită ca agentul LLM-ului să inițieze spontan un comportament procedural. Dar prezentarea agentului a unei cereri specifice, posibil greșite ("Ar trebui să faci X - încă o faci?") declanșează în mod fiabil un comportament corectiv atunci când cererea este greșită. Agentul nu trebuie să-și amintească să verifice. Nepotrivirea dintre starea prezentată și cea actuală creează un eveniment de corecție la care agentul LLM răspunde în mod natural. Asta îmi amintește de vechiul maxim "cel mai bun mod de a obține un răspuns corect pe internet este să postezi unul greșit" și cred că are sens, având în vedere că LLM-urile sunt în principal "cunoașterea" distilată a internetului. Oricum, am construit un sistem de memorie de lungă durată pentru agenții mei și implementarea lui în acest mod a rezolvat multe probleme.