Vielä suuremman läpimenon ja alhaisemman viiveen saamiseksi: erägenerointi + tensori rinnakkain mlx-lm + ja mlx.distributedin kanssa. Tässä se tuottaa 63 tok/s (läpimeno) GLM 4.7:llä 6-bittisessä ja eräkoossa 4 neljällä M3 Ultralla: