المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
أطلقت TII، مختبر الذكاء الاصطناعي الجامعي مقره الإمارات العربية المتحدة، نموذج فالكون-H1R-7B، وهو نموذج صغير للاستدلال المفتوح الأوزان يقارن جيدا بالنماذج ذات الحجم المماثل
🧠 درجة الذكاء القوية بين نماذج <12B: حصل فالكون-H1R-7B على 16 في مؤشر الذكاء التحليلي الصناعي المحدث v4.0 - متقدما على NVIDIA Nemotron Nano 12B V2، لكنه أقل من Qwen3 VL 8B. النموذج في موقع جيد على حدود باريتو من حيث الذكاء مقابل المعاملات الكلية للنماذج المماثلة. مقارنة بالنماذج الأخرى <12B، تحقق فالكون-H1R-7B أداء جيدا بشكل خاص في 3 تقييمات فردية - اختبار الإنسانية الأخير (التفكير والمعرفة)، τ²-Bench Telecom (استخدام أداة الوكلاء)، وIFBench (اتباع التعليمات)
🇦🇪 ثاني مشاركة في قائمة المتصدرين في الإمارات العربية المتحدة: بعد نموذج K2-V2 من MBZUAI، يعد فالكون-H1R-7B ثاني طراز من شركة مقرها الإمارات على لوحات المتصدرين لدينا، وسط بحر من الطرازات الأمريكية والصينية. تأسس معهد الابتكار التكنولوجي (TII) من قبل حكومة أبوظبي، وهو مركز بحثي عالمي مهمته دفع حدود المعرفة، ويعمل بنشاط في مجالات متعددة تشمل الطاقة والتكنولوجيا الكمومية والتشفير. لديهم أكثر من 100 نموذج وأوزان مفتوحة ونسخ على هاجينغفيس
📖 نموذج متوسط الانفتاح: حصل فالكون-H1R-7B على درجة 44 في مؤشر الانفتاح التحليلي الصناعي - مقياسنا الموحد والتقييم المستقل الذي أصدرنا حديثا لانفتاح نموذج الذكاء الاصطناعي عبر التوفر والشفافية. هذا يضعه متقدما على GPT-OSS-20B من OpenAI، لكنه خلف Qwen3 VL8B. نماذجنا الأكثر انفتاحا، من MBZUAI ومعهد ألين الذكاء الاصطناعي، تتساوى في قائمة المتصدرين عند 89، مدفوعة بشفافية أكبر والوصول إلى منهجية التدريب والبيانات
📈 الرموز عالية الإنتاج: استخدم النموذج 140 مليون رمز لإكمال مؤشر الذكاء الخاص بنا. وهذا يضعها في مرتبة أقل من GLM-4.7، لكنها أعلى من معظم الطرازات الأخرى - سواء في فئة الحجم أو بين الطرازات الحدودية
📘 المعرفة المتوقعة لحجمها، معدل هلوسة متوسط: AA-Omniscience هو معيارنا الجديد الذي يقيس المعرفة الواقعية وهلوسة النماذج. تحصل فالكون-H1R-7B على درجة متوسطة -62. درجة دقة المعرفة (14) ضمن التوقعات، نظرا لأننا نرى ارتباطا قويا بين حجم النموذج والدقة (عدد الحقائق التي يتذكرها النموذج بشكل صحيح). يعاني النموذج من الهلوسة بنسبة 87٪ من الوقت عندما لا يتذكر الإجابات بشكل صحيح - وهو تقييم متوسط بين النماذج الحدودية والنماذج الصغيرة ذات الأوزان المفتوحة على حد سواء
مبروك على الإطلاق @TIIuae!

فالكون-H1R-7B هو الطراز الثاني من شركة مقرها الإمارات على لوحات المتصدرين لدينا، وسط بحر من الطرازات الأمريكية والصينية

حصل فالكون-H1R-7B على درجة متوسطة في مؤشر الانفتاح للتحليل الصناعي

استخدم النموذج 140 مليون رمز لإكمال مؤشر الذكاء - أقل من GLM-4.7، لكنه أعلى من معظم النماذج الأخرى

يحصل فالكون-H1R-7B على درجة متوسطة في AA-العلم المطلق، مع معرفة متوقعة بحجمها ومعدل هلوسة متوسط

مقارنة بالنماذج المماثلة، يؤدي فالكون-H1R-7B أداء جيدا في اختبار الإنسانية الأخير (التفكير والمعرفة)، وτ²-Bench Telecom (استخدام الأدوات الوكالية)، وIFBench (اتباع التعليمات)

مزيد من التحليل الصناعي:
رابط العناق فيس 🤗:
التقرير الفني:
23.07K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
