MiniMax-M2.5 NVFP4 berjalan pada 2x RTX 6000 > 83 token/detik aliran tunggal > memungkinkan hingga 32 pengguna bersamaan > mendorong 1000+ token/detik > ini biayanya ~2x 512GB Mac Studios > kecuali Mac = 1 prompt sekaligus > dan bahkan token yang lebih lambat/detik Model > pada HF > lukealonso/MiniMax-M2.5-NVFP4