Folosind noul server_benchmark MLX pentru batching continuu pentru a trimite MiniMax M2.1 local pe M3 Ultra. 4bit: 1 cerere: 48 t/s 32 cereri: 220 t/s 🔥 8bit: 1 cerere: 36 t/s 32 solicitări: 150t/s 🔥