Het draaien van de volledige GLM 4.7 (8-bit) op 2 x 512GB M3 Ultra Mac Studios Draait op 19,8 tok/sec met @exolabs MLX RDMA backend (h/t @awnihannun) & tensor parallel