كلود أوبوس 4.5 يصدر اليوم. إنه متقدم في البرمجة والوكلاء واستخدام الكمبيوتر، وأفضل بشكل ملحوظ في المهام اليومية مثل إنتاج جداول البيانات والشرائح. إليكم ما نراه:
التعليقات المستمرة من المختبرين الداخليين هي أنه "يفهمها". يتعامل مع الغموض، والأسباب المتعلقة بالمقايضات دون توجيه لها. المهام التي كانت شبه مستحيلة بالنسبة للسونيت 4.5 أصبحت الآن في متناول اليد.
على سبيل المثال، نقدم لمرشحي هندسة الأداء اختبارا صعبا جدا في المنزل. خلال فترة زمنية مدتها ساعتان، حقق أوبوس 4.5 درجات أعلى من أي مرشح بشري على الإطلاق.
كما أنه أكثر كفاءة بشكل كبير. في نسخة SWE-bench Verified بجهد متوسط، يتفوق Opus 4.5 على Sonnet 4.5 مع استخدام رموز إخراج أقل بنسبة 76٪. المعامل الجديد للجهد يسمح لك بمقايضة الذكاء مقابل التكلفة/الكمون باستخدام قرص واحد.
‏‎295.36‏K