بحث جديد من مايكروسوفت. Phi-4-reasoning-vision-15B هو نموذج استدلال متعدد الوسائط مكون من 15 مليار معاملة، يجمع بين الفهم البصري وقدرات الاستدلال المنظم. كما قلت، ليست كل مهمة وكيل تحتاج إلى نموذج فرينتر. رؤية الاستدلال في Phi-4 تظهر ما هو ممكن عند 15 مليار معلمة. يوضح التقرير كيف دربوا نموذجا مدمجا يمكنه التفكير في النصوص والصور، مستهدفا النقطة المثلى بين القدرة والكفاءة. نماذج التفكير الأصغر التي تتعامل مع الرؤية ضرورية لنشر الوكلاء العملي. الورقة: تعلم كيفية بناء وكلاء ذكاء اصطناعي فعالين في أكاديميتنا: