Ejecutando el GLM 4.7 completo (8 bits) en 2 x 512GB M3 Ultra Mac Studios Funciona a 19.8 tok/seg con el backend RDMA de @exolabs MLX (gracias a @awnihannun) y paralelismo de tensores