MiniMax-M2.5 NVFP4 läuft auf 2x RTX 6000 > 83 Tokens/Sekunde bei einem einzelnen Stream > ermöglicht bis zu 32 gleichzeitige Benutzer > drückt 1000+ Tokens/Sekunde > das kostet ~2x 512GB Mac Studios > außer Mac = 1 Eingabeaufforderung zur Zeit > und sogar langsamere Tokens/Sekunde > Modell auf HF > lukealonso/MiniMax-M2.5-NVFP4