GLM-4.7-8bit (350GB) a funcionar a 19 toks/s em dois M3 Ultra 512GB usando Paralelismo Tensorial com EXO - MLX, em comparação com 14 toks/s com um único nó. 🚀 Agora a fazer benchmarking de contexto & depois testes OpenCode 🔥 Nota: isto é de fontes, tive que mudar algumas coisas para o fazer funcionar.