أنا لم أفعلها! إنه يجدي نفعًا! استخدام GLM-4.7-4bit مع mlx_lm.server وopencode لإصلاح الكود الحقيقي محليا! 🔥 هنا M3 Ultra 512GB واحد، الطور nex step سيكون 2 باستخدام Tensor Parallelism ثم يطبق نفس التغييرات على exo. التعبئة المسبقة بطيئة على جهاز واحد، لكن التوليد جيد.