Utilizzando il nuovo server_benchmark MLX per il batching continuo per eseguire MiniMax M2.1 localmente su M3 Ultra. 4bit: 1 richiesta: 48 t/s 32 richieste: 220 t/s 🔥 8bit: 1 richiesta: 36 t/s 32 richieste: 150t/s 🔥