GLM-4.7-8bit (350GB) draait op 19 toks/s op twee M3 Ultra 512GB met Tensor Parallelism met EXO - MLX, versus 14 toks/s met een enkele node. 🚀 Nu context benchmarking & dan OpenCode tests 🔥 Opmerking: dit is van bronnen, ik moest dingen aanpassen om het te laten draaien.