لقد اكتشفت طريقة لتحسين توجيه الوكلاء. وتحديدا، كيف تحسن الأداء عندما تقول "تأكد من القيام بذلك" ولا يقوم نموذج اللغة الكبيرة بذلك. ها هو: قول "تذكر أن تفعل كذا" غير موثوق - فهو يتطلب من الوكيل أن يبدأ سلوكا إجرائيا تلقائيا. لكن تقديم مطالبة محددة قد تكون خاطئة للوكيل ("يجب أن تفعل X - هل ما زلت تفعله؟") يؤدي بشكل موثوق إلى تحفيز سلوك تصحيحي عندما تكون المطالبة خاطئة. الوكيل لا يحتاج أن يتذكر التحقق. التفاوت بين الحالة المعروضة والحالة الفعلية يخلق حدث تصحيح يستجيب له نموذج اللغة الكبيرة العامل بشكل طبيعي. هذا يذكرني بالمثل القديم "أفضل طريقة للحصول على إجابة صحيحة على الإنترنت هي نشر إجابة خاطئة"، وأعتقد أن هذا منطقي لأن نماذج اللغة الكبيرة هي في الغالب "المعرفة" المستجمعة من الإنترنت. على أي حال، كنت أبني نظام ذاكرة طويل الأمد لوكلائي وتنفيذه بهذه الطريقة أصلح الكثير من المشاكل.