GLM-4.7-8bit (350GB), iki M3 Ultra 512GB üzerinde EXO - MLX ile Tensor Paralelliği kullanarak 19 tok/s hızında çalışıyor, tek düğümde ise 14 tok/s hızında. 🚀 Şimdi bağlam kıyaslaması ve ardından OpenCode testleri 🔥 Not: Bu kaynaklardan, çalıştırmak için bazı şeyleri değiştirmem gerekti.