MiniMax-M2.5 NVFP4 werkt op 2x RTX 6000 > 83 tokens/sec enkele stroom > staat tot 32 gelijktijdige gebruikers toe > duwt 1000+ tokens/sec > dit kost ~2x 512GB Mac Studios > behalve dat Mac = 1 prompt tegelijk > en zelfs langzamere tokens/sec > model op HF > lukealonso/MiniMax-M2.5-NVFP4