MYCKET UPPHETSAD: Första Minimax m2.5 NVFP4 kvant på huggingface. 83tok/s enkel stream vllm på dual RTX 6000. Eller ungefär dubbelt så hög hastighet som ett Mac 512GB-system som kostar hälften så mycket. Fast Macen kan inte heller göra 1000+ tok/s via 32+ samtidiga anslutningar. Effektgränsen @ 550W per GPU för detta test. lukealonso/MiniMax-M2.5-NVFP4 vllm-receptet jag använde i bild-alttext