VEEL OPWINDING: Eerste Minimax m2.5 NVFP4 quant op huggingface. 83tok/s enkele stroom vllm op dual RTX 6000. Of ongeveer twee keer de snelheid van een Mac 512gb systeem dat de helft kost. Behalve dat de Mac ook niet 1000+ tok/s kan doen via 32+ gelijktijdige verbindingen. Vermogenslimiet @ 550W per gpu voor deze test. lukealonso/MiniMax-M2.5-NVFP4 vllm-recept dat ik gebruikte in de alt-tekst van de afbeelding