Das vollständige GLM 4.7 (8-Bit) auf 2 x 512GB M3 Ultra Mac Studios ausführen Läuft mit 19,8 tok/Sekunde mit @exolabs MLX RDMA-Backend (danke an @awnihannun) & Tensorparallelität