MiniMax-M2.5 NVFP4 2x RTX 6000 ile çalışıyor > 83 jeton saniye tek akış >, eşzamanlı olarak 32 kullanıcıya kadar izin verir > saniyede 1000+ jeton kullanıyor > bunun maliyeti ~2x 512GB Mac Studios > Mac = 1 prompt bir anda > ve daha da yavaş jeton / saniye > HF modeli > lukealonso/MiniMax-M2.5-NVFP4