Použití nového MLX server_benchmark pro kontinuální dávkování pro lokální tlačení MiniMax M2.1 na M3 Ultra. 4bit: 1 požadavek: 48 t/s 32 požadavků: 220 t/s 🔥 8bit: 1 požadavek: 36 t/s 32 požadavků: 150t/s 🔥