أعتقد أنه حان الوقت للبدء في الحديث عن AgentOps. DevOps → MLOps → AgentOps إذا أردت وكلاء مستقلين يعملون ويتسعون على نطاق واسع، علينا أن نبدأ في صياغة التخصص الذي يدعمهم. بعض الأمور التي *الجميع* يجب أن يقلقوا بشأنها: • تقييمات الوكلاء (باستخدام نموذج اللغة الكبيرة كحكم أو أي تقنية أخرى) • إصدارات تعتمد على المقاييس (تصدر إصدارات جديدة عندما تتجاوز الحد الأقصى) • اختبارات عوامل A/B، إطلاق الكناري، نشر الظلال • تمكين الملاحظة والتتبع • تنفيذ ودمج حلقات التغذية الراجعة البشرية لا يمكنك بناء وكيل موثوق دون القلق بشأن كل ما سبق.