GLM-4.7-8bit (350GB) funcionando a 19 toks/s en dos M3 Ultra 512GB utilizando Paralelismo Tensorial con EXO - MLX, en comparación con 14 toks/s con un solo nodo. 🚀 Ahora benchmarking de contexto & luego pruebas de OpenCode 🔥 Nota: esto es de fuentes, tuve que cambiar cosas para hacerlo funcionar.