Usando o novo MLX server_benchmark para lote contínuo para lançar o MiniMax M2.1 localmente no M3 Ultra. 4bit: 1 pedido: 48 t/s 32 solicitações: 220 t/s 🔥 8bit: 1 pedido: 36 t/s 32 pedidos: 150t/s 🔥