🚨 هذه الورقة هي السبب في أن معظم عروض الوكلاء لن تنجو من المستخدمين الحقيقيين. بمجرد إضافة الأدوات والذاكرة والاستقلالية، ينكسر كل "دفاع محفز". هذا لا يفعل ذلك. معظم "دفاعات الحقن الفوري" تنهار بمجرد إضافة العوامل أو الأدوات أو الذاكرة. تقترح الورقة خط أنابيب أمني مكون من ثلاثة عملاء بالإضافة إلى وكيل تقييم رابع. لكل وكيل دور ثابت: التوليد، التعهير، تنفيذ السياسات. لا نقاشات. لا يوجد أجواء. مجرد دفاع متعدد الطبقات. يتم فحص كل مخرج وسيط وتسجيله وتسجيله. الاختراق الحقيقي هو التعلم المتداخل. بدلا من التعامل مع المحفزات كأحداث بلا حالة، يمتلك كل وكيل نظام ذاكرة مستمرة مع ذاكرة متوسطة وطويلة المدى. يتم تضمين المحفزات ومطابقتها بشكل دلالي. إذا بدا هجوم جديد مشابها لما ظهر من قبل، يعيد الوكيل استخدام استجابة موثقة بدلا من إعادة توليدها. هذا يفعل ثلاثة أشياء في نفس الوقت. 1، الأمن. عبر 301 هجوم حقن فوري حقيقي عبر 10 عائلات هجوم، لم يحقق النظام أي اختراقات عالية الخطورة. ليس تقليل المخاطر. صفر. 2، الملاحظة. يقدمون مقياسا جديدا يسمى OSR يقيس مقدار المنطق الأمني المكشوف في عمليات التدقيق. وبشكل غير متوقع، كان التكوين الذي يتمتع بأكبر قدر من الشفافية هو الأفضل بشكل عام. 3، الاستدامة. خفض التخزين المؤقت الدلالي استدعاءات نماذج اللغة الكبيرة بنسبة 41.6٪، مما خفض التأخير من ~9 ثوان إلى 150 مللي ثانية للمسارات المخزنة مؤقتا. قلة المكالمات تعني تكلفة أقل، واستهلاك طاقة أقل، وانبعاثات كربونية أقل دون أن تلامس أوزان الطرازات. الخلاصة تكون غير مريحة لمعظم الوكلاء. الأمان لا يأتي من التعليمات الذكية. يأتي من تخصص العمارة والذاكرة والتقييم. هذه واحدة من أوضح المخططات حتى الآن لذكاء الذكاء الاصطناعي الوكيل الآمن والمستدام من مستوى الإنتاج. اقرأ الورقة كاملة هنا: