とてもワクワクする:初めてのミニマックス m2.5 NVFP4 クアントをハギングフェイスで見せた。デュアルRTX 6000で83tok/sのシングルストリームVLMです。あるいは、Macの512GBシステムの約2倍の速度で、その価格は半分です。ただし、Macは32+同時接続で1000+ tok/sも実現できません。このテストでは1GPUあたりのパワー制限@550Wです。 lukealonso/MiniMax-M2.5-NVFP4 画像の代替テキストで使ったVLMレシピ