GLM-4.7-8bit (350GB) in esecuzione a 19 toks/s su due M3 Ultra 512GB utilizzando il Tensor Parallelism con EXO - MLX, rispetto a 14 toks/s con nodo singolo. 🚀 Ora benchmarking del contesto & poi test OpenCode 🔥 Nota: questo proviene da fonti, ho dovuto cambiare alcune cose per farlo funzionare.