Используя новый сервер MLX_server_benchmark для непрерывной пакетной обработки, чтобы запустить MiniMax M2.1 локально на M3 Ultra. 4 бита: 1 запрос: 48 т/с 32 запроса: 220 т/с 🔥 8 бит: 1 запрос: 36 т/с 32 запроса: 150 т/с 🔥