GLM-4.7-8bit (350GB) rulând la 19 toks/s pe două M3 Ultra 512GB folosind Tensor Parallelism cu EXO - MLX, față de 14 toks/s cu un singur nod. 🚀 Acum benchmarking context și apoi teste 🔥 OpenCode Notă: asta provine din surse, a trebuit să schimb lucruri ca să o pot rula.