GLM-4.7-8bit (350GB) berjalan pada 19 toks/s pada dua M3 Ultra 512GB menggunakan Tensor Parallelism dengan EXO - MLX, versus 14 toks/s dengan node tunggal. 🚀 Sekarang benchmarking konteks & kemudian pengujian 🔥 OpenCode Catatan: ini dari sumber, saya harus mengubah hal-hal untuk menjalankannya.