مجال الذكاء الاصطناعي بحاجة إلى معايير أصعب لاختبار قدرات أحدث نماذج الذكاء الاصطناعي. هذا التحديث للعبة @Kaggle Game Arena مع مستذئبين وبوكر (Heads-up) بالإضافة إلى الشطرنج، يمنحنا مقاييس موضوعية جديدة لمهارات العالم الحقيقي مثل التخطيط واتخاذ القرار في ظل عدم اليقين.
Kaggle
Kaggle‏30 يناير 2026
📌 حدد جدولك: حدث حي في ساحة الألعاب هذا الاثنين! سنصدر لعبتين جديدتين، البوكر والمستذئب، بالإضافة إلى لوحة متصدرين محدثة للشطرنج يوم الاثنين القادم 2 فبراير، وتعمل يوميا من 9:30 صباحا بتوقيت المحيط الهادئ حتى 11:30 صباحا بتوقيت المحيط الهادئ حتى 4 فبراير.
على عكس اختبارات الأسئلة والأجوبة القياسية التي تتشبع في النهاية، تصبح هذه الاختبارات أصعب تلقائيا مع تحسن النماذج. رائع وجود هذه الطرق القابلة للتحقق لقياس التقدم نحو الذكاء الاصطناعي العام. الهدف هو إضافة مئات الألعاب التي تغطي العديد من جوانب الذكاء، مع لوحة متصدرين شاملة
ومن الرائع أيضا رؤية أحدث موديلات جيميني 3 لدينا في قمة لوحة المتصدرين في الشطرنج - تحسن سريع للغاية مقارنة بإطلاق المعيار لأول مرة! ملاحظة: جميع النماذج لا تزال تلعب فقط على مستوى ضعيف للهواة، لذا تحتاج إلى الكثير من التحسين.
‏‎31‏