GLM-4.7-8bit (350GB) kjører i 19 toks/s på to M3 Ultra 512GB ved bruk av Tensor Parallelism med EXO - MLX, mot 14 toks/s med én node. 🚀 Nå kontekstbenchmarking og deretter OpenCode-tester 🔥 Merk: dette er fra kilder, jeg måtte endre ting for å kunne kjøre det.