Usando el nuevo servidor MLX_server_benchmark para el procesamiento continuo por lotes para impulsar MiniMax M2.1 localmente en M3 Ultra. 4bit: 1 solicitud: 48 t/s 32 solicitudes: 220 t/s 🔥 8bit: 1 solicitud: 36 t/s 32 solicitudes: 150t/s 🔥