MiniMax-M2.5 NVFP4 работает на 2x RTX 6000 > 83 токена/секунда в одном потоке > позволяет до 32 одновременных пользователей > выдаёт 1000+ токенов/секунда > это стоит ~2x 512GB Mac Studios > кроме того, Mac = 1 запрос за раз > и даже медленнее токены/секунда > модель на HF > lukealonso/MiniMax-M2.5-NVFP4