Kör hela GLM 4.7 (8-bitars) på 2 x 512GB M3 Ultra Mac Studios Körs i 19,8 tok/s med @exolabs MLX RDMA-backend (h/t @awnihannun) och tensorparallell