Usando o novo servidor MLX_server_benchmark para processamento contínuo para enviar o MiniMax M2.1 localmente no M3 Ultra. 4bit: 1 pedido: 48 t/s 32 pedidos: 220 t/s 🔥 8bit: 1 pedido: 36 t/s 32 pedidos: 150t/s 🔥