MiniMax-M2.5 NVFP4 kjører på 2x RTX 6000 > 83 tokens/sek enkeltstrøm > tillater opptil 32 samtidige brukere > presser 1000+ tokens/sekund > dette koster ~2x 512GB Mac Studios > bortsett fra Mac = én prompt om gangen > og enda tregere tokens per sekund > modell på HF > lukealonso/MiniMax-M2.5-NVFP4