Eseguendo il GLM 4.7 completo (8-bit) su 2 x 512GB M3 Ultra Mac Studios Funziona a 19.8 tok/sec con il backend MLX RDMA di @exolabs (grazie a @awnihannun) e parallelismo dei tensori