Rodando o GLM 4.7 completo (8 bits) em 2 Mac Studios M3 Ultra de 512GB Roda a 19,8 tok/seg com @exolabs backend MLX RDMA (h/t @awnihannun) e tensor paralelo