لقد أمضيت فترة ما بعد الظهيرة في اختبار منتج أتمتة المستهلك الجديد من ChatGPT - الوكيل. أين يعمل ، وأين يقصر؟ وكيف يمكن مقارنتها ب Operator (والمنتجات الأحدث مثل Perplexity's Comet)؟ تقييمي 👇
كما أنها غالبا ما "تبالغ" في المهام البسيطة - لكنها لم تستطع إكمال المهام الأكثر تعقيدا. استغرق الوكيل على سبيل المثال دقيقة كاملة للعثور على تاريخ / وقت 1: 1 حديث ، ولم يتمكن من جدولة واحدة جديدة (أدناه سرعة 4x ⬇️) وجد المذنب نفس المعلومات وأرسل دعوة جديدة في <10 ثوان.
حدود الخصوصية والأمان في ChatGPT تعترض الطريق أيضا. وافق الوكيل على عمل ملصق عيد ميلاد @illscience ، وسحب التاريخ من التقويم الخاص بي وصورة له من الإنترنت. لكن النتيجة النهائية (استغرقت 13 دقيقة) حجب اسمه وصورته "لأسباب تتعلق بالخصوصية" 🤦 ♀️
ما الذي يجيده الوكيل حقا؟ الحصول على السبق في مهام البحث أو الحساب غير الحساسة للوقت. على سبيل المثال ، أنشأ الوكيل نموذج DCF ل NVIDIA (بتنسيق Excel القابل للتنزيل!) في 25 دقيقة. التنسيق ليس بالضبط كيف كنت سأفعل ذلك ، ولكن هذه خطوة كبيرة إلى الأمام.
‏‎266.78‏K