Chạy GLM 4.7 đầy đủ (8-bit) trên 2 x 512GB M3 Ultra Mac Studios Chạy với tốc độ 19.8 tok/giây với backend MLX RDMA của @exolabs (cảm ơn @awnihannun) & song song tensor