Kjører full GLM 4.7 (8-bit) på 2 x 512GB M3 Ultra Mac Studios Kjører på 19,8 tok/sek med @exolabs MLX RDMA backend (h/t @awnihannun) og tensor parallel