Menjalankan GLM 4.7 penuh (8-bit) pada 2 x 512GB M3 Ultra Mac Studios Berjalan pada 19,8 tok/detik dengan backend MLX RDMA @exolabs (h/t @awnihannun) & tensor paralel