MiniMax-M2.5 NVFP4 in esecuzione su 2x RTX 6000 > 83 token/sec flusso singolo > consente fino a 32 utenti contemporanei > spingendo oltre 1000 token/sec > questo costa ~2x 512GB Mac Studios > tranne che Mac = 1 prompt alla volta > e anche token/sec più lenti > modello su HF > lukealonso/MiniMax-M2.5-NVFP4