المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
لقد اكتشفت طريقة لتحسين توجيه الوكلاء. وتحديدا، كيف تحسن الأداء عندما تقول "تأكد من القيام بذلك" ولا يقوم نموذج اللغة الكبيرة بذلك. ها هو:
قول "تذكر أن تفعل كذا" غير موثوق - فهو يتطلب من الوكيل أن يبدأ سلوكا إجرائيا تلقائيا. لكن تقديم مطالبة محددة قد تكون خاطئة للوكيل ("يجب أن تفعل X - هل ما زلت تفعله؟") يؤدي بشكل موثوق إلى تحفيز سلوك تصحيحي عندما تكون المطالبة خاطئة.
الوكيل لا يحتاج أن يتذكر التحقق. التفاوت بين الحالة المعروضة والحالة الفعلية يخلق حدث تصحيح يستجيب له نموذج اللغة الكبيرة العامل بشكل طبيعي.
هذا يذكرني بالمثل القديم "أفضل طريقة للحصول على إجابة صحيحة على الإنترنت هي نشر إجابة خاطئة"، وأعتقد أن هذا منطقي لأن نماذج اللغة الكبيرة هي في الغالب "المعرفة" المستجمعة من الإنترنت.
على أي حال، كنت أبني نظام ذاكرة طويل الأمد لوكلائي وتنفيذه بهذه الطريقة أصلح الكثير من المشاكل.
الأفضل
المُتصدِّرة
التطبيقات المفضلة
