MiniMax-M2.5 NVFP4 uruchomiony na 2x RTX 6000 > 83 tokeny/sekundę pojedynczy strumień > pozwala na do 32 równoczesnych użytkowników > osiągając 1000+ tokenów/sekundę > to kosztuje ~2x 512GB Mac Studios > z wyjątkiem Mac = 1 zapytanie na raz > i jeszcze wolniejsze tokeny/sekundę > model na HF > lukealonso/MiniMax-M2.5-NVFP4