نقدم التقرير الفني ل GLM-5! بعد إطلاق GLM-5، بدأنا نكشف عن كيفية بنائه. تشمل الابتكارات الرئيسية: - اعتماد DSA: يقلل بشكل كبير من تكاليف التدريب والاستدلال مع الحفاظ على دقة السياق الطويل - البنية التحتية غير المتزامنة للتعلم التقدي: تحسن بشكل كبير كفاءة ما بعد التدريب من خلال فصل التوليد عن التدريب - خوارزميات التعلم المعزز للوكلاء: تمكن النموذج من التعلم من التفاعلات المعقدة والطويلة الأفق بشكل أكثر فعالية من خلال هذه الابتكارات، يحقق GLM-5 أداء SOTA بين النماذج مفتوحة المصدر، مع نتائج قوية بشكل خاص في مهام هندسة البرمجيات الواقعية.