MiniMax-M2.5 NVFP4 运行在 2x RTX 6000 > 单流 83 个令牌/秒 > 允许最多 32 个并发用户 > 推送 1000+ 个令牌/秒 > 这大约花费 ~2x 512GB Mac Studios > 除了 Mac = 一次一个提示 > 甚至更慢的令牌/秒 > 模型在 HF > lukealonso/MiniMax-M2.5-NVFP4