MiniMax-M2.5 NVFP4 funcionando en 2x RTX 6000 > 83 tokens/seg flujo único > permite hasta 32 usuarios concurrentes > empujando a 1000+ tokens/seg > esto cuesta ~2 Mac Studios de 512GB > excepto Mac = 1 prompt a la vez > y tokens por segundo aún más lentos > modelo en HF > Lukealonso/MiniMax-M2.5-NVFP4