المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
هذا المخطط قديم بالفعل ولا أحد يتحدث عنه.
تظهر لوحة المتصدرين "Anthropic Opus 4.5" بنسبة 76.1٪. تم إطلاق أوبوس 4.6 في 5 فبراير، بعد يوم واحد من نشر Perplexity هذه النتائج. تقول ملاحظات إصدار Anthropic نفسها إن Opus 4.6 "حسن كل من BrowseComp وDeepSearchQA." على موقع BrowseComp، كان هذا التحسن 16 نقطة مئوية (67.8٪ مقابل 84.0٪). ليس لدينا رقم DeepSearchQA بعد، لكن إذا كانت القفزة نصف هذا الحجم حتى النصف، فإن أوبوس 4.6 المستقل سيكون فوق نسبة Perplexity البالغة 79.5٪.
هنا تصبح الأمور مثيرة للاهتمام. تقوم شركة بيربلكستي Advanced Deep Research بتشغيل كل استعلام على أوبوس 4.5. وقد تم تأكيد ذلك في إعلانهم الخاص. Opus 4.6 متاح بالفعل على واجهة برمجة التطبيقات الخاصة ب Perplexity للعبة Comet، لكن Deep Research لم تنتقل بعد. لذا فإن النتيجة "الحديثة" التي يسميها كوبيسي أخبارا عاجلة تم مقارنة نموذج تم استبداله بعد 24 ساعة.
كما أن إطار "Perplexity beats Anthropic" يدفن حقيقة أن محرك Perplexity هو Anthropic. كل استعلام في Advanced Deep Research يدير Opus 4.5 عبر سلسلة البحث الوكائلية الخاصة ب Perplexity. الأنثروبي هو الأساس. الحيرة هي السقالة. الفارق البالغ 3.4 نقطة بينهما (79.5٪ مقابل 76.1٪) هو قيمة خط أنابيب الاسترجاع في Perplexity فوق منطق Anthropic.
ثلاثة أشياء على وشك الحدوث. تقدم أنثروبيك أوبوس 4.6 إلى لوحة المتصدرين. تقوم Perplexity بترقية Deep Research من 4.5 إلى 4.6. ويتم إعادة ترتيب هذا المخطط بالكامل خلال أسابيع. مشاركة لمحة لسباق اختبار في منتصف الخطوة وتسميته "متحطمة" هو ما يجعلك تحصل على 186 ألف مشاهدة وعدم وجود أي رؤى.
الأفضل
المُتصدِّرة
التطبيقات المفضلة
