اليوم الخامس من #ScienceAIBench: تحديد 🎯 الهدف نواصل سلسلة الإطلاقات اليومية مع اليوم الخامس، محولا التركيز من الخصائص الجزيئية إلى التحدي المعقد لاكتشاف الأهداف البيولوجية. تحديد الهدف العلاجي الصحيح هو الخطوة الأكثر أهمية في تطوير الدواء لتجنب الإخفاقات السريرية المكلفة. اليوم، نتعمق أكثر في المعلوماتية الحيوية ونقدم نتائج وحدة TargetBench. يبدأ النجاح في اكتشاف الأدوية بالهدف الصحيح. يقيم معيار اليوم قدرة نماذج الذكاء الاصطناعي الرائدة على استعادة الأهداف السريرية المعروفة للأمراض الليفية المعقدة، مع التمييز بين الإشارات البيولوجية الحقيقية والضوضاء. كما نشرنا نسخة أولية توضح منهجيتنا والنتائج الكاملة، والمتوفرة الآن إلى جانب بيانات المعيار الحية على موقعنا الإلكتروني. 📄 اقرأ النسخة التمهيدية: [ 🌐 عرض المعيار: [ 📋 مواصفات الاختبار: أعراض المرض: التليف الرئوي مجهول السبب (IPF)، تصلب الشرايين، والتهاب المفاصل العظمي. المقياس: استرجاع الأهداف السريرية (CTR) — نسبة الأهداف السريرية المعروفة التي تم استرجاعها في توقعات النموذج الأعلى تصنيفا. النماذج التي تم تقييمها: GPT-5، كلود أوبوس 4، جروك 4، وDeepSeek R1. 📊 الأداء الملحوظ: أفضل أداء: أظهر GPT-5 أعلى استدعاء سريري للهدف عبر جميع المؤشرات المختبرة، حيث حقق 0.474 لتصلب الشرايين و0.352 لتصلب الشرايين (IPF). تدرج الأداء: توجد فجوة واضحة بين النماذج؛ احتل كلود أوبوس 4 المرتبة الثانية (مثلا 0.377 لتصلب الشرايين)، بينما أظهر Grok 4 وDeepSeek R1 معدلات استرجاع أقل عموما. تحدي الأمراض المعقدة: ثبت أن IPF هو المؤشر الأصعب لتحديد الخطوط الأساسية، حيث سجل جروك 4 أدنى درجة له وهي 0.199، مما يبرز صعوبة التفكير في الطب الليفي المعقد. الاتجاه العام: تكشف البيانات عن تدرج كبير في قدرات الاستدلال لاكتشاف الأهداف البيولوجية، مع مستويات أداء واضحة بين أجيال النماذج. 🔄 نسخة محدثة من TargetBench مع مؤشرات موسعة للأمراض ستصدر قريبا. تابعونا لمزيد من المعلومات. #ScienceAI #InsilicoBench #DrugDiscovery #الذكاء الاصطناعي #TargetIdentification #Bioinformatics #MachineLearning