GLM-4.7-8bit (350GB) läuft mit 19 toks/s auf zwei M3 Ultra 512GB unter Verwendung von Tensor Parallelism mit EXO - MLX, im Vergleich zu 14 toks/s mit einem einzelnen Knoten. 🚀 Jetzt Kontext-Benchmarking & dann OpenCode-Tests 🔥 Hinweis: Dies stammt aus Quellen, ich musste Dinge ändern, um es auszuführen.