GLM-4.7-8bit (350GB) rodando a 19 toks/s em dois M3 Ultra 512GB usando Tensor Parallelism com EXO - MLX, contra 14 toks/s com um único nó. 🚀 Agora benchmarking de contexto e depois testes 🔥 OpenCode Nota: isso vem de fontes, tive que mudar coisas para rodar.