GLM-4.7-8 bits (350GB) funcionando a 19 toks/s en dos M3 Ultra de 512GB usando paralelismo Tensor con EXO - MLX, frente a 14 toks/s con un solo nodo. 🚀 Ahora benchmarking de contexto y después pruebas 🔥 OpenCode Nota: esto es de fuentes, tuve que cambiar cosas para poder ejecutarlo.