GLM-4.7-8-بت (350GB) يعمل بسرعة 19 توك/ثانية على جهازي M3 Ultra 512GB باستخدام Tensor Parallelism مع EXO - MLX، مقابل 14 توك/ث مع عقدة واحدة. 🚀 الآن اختبار السياق ثم اختبارات 🔥 OpenCode ملاحظة: هذا من مصادر، اضطررت لتغيير بعض الأشياء لتشغيله.