MiniMax-M2.5 NVFP4 rulând pe 2x RTX 6000 > 83 jetoane/secundă flux simplu > permite până la 32 de utilizatori simultani > să împingi 1000+ jetoane pe secundă > asta costă ~2x 512GB Mac Studios > doar Mac = 1 prompt pe rând > și jetoane și mai lente pe secundă > model pe HF > Lukealonso/MiniMax-M2.5-NVFP4