Запускаю повний GLM 4.7 (8-бітний) на 2 x 512GB M3 Ultra Mac Studios Працює зі швидкістю 19,8 ток/сек з @exolabs бекендом MLX RDMA (h/t @awnihannun) і тензорним паралелем