MiniMax-M2.5 NVFP4 funcionando en 2x RTX 6000 > 83 tokens/segundo en un solo flujo > permite hasta 32 usuarios concurrentes > empujando 1000+ tokens/segundo > esto cuesta ~2x 512GB Mac Studios > excepto que Mac = 1 solicitud a la vez > y tokens/segundo incluso más lentos > modelo en HF > lukealonso/MiniMax-M2.5-NVFP4