DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

MOLTO ECCITANTE: Primo Minimax m2.5 NVFP4 quant su huggingface. 83tok/s flusso singolo vllm su doppie RTX 6000. O circa il doppio della velocità di un sistema Mac da 512gb che costa la metà. A meno che il Mac non possa anche fare 1000+ tok/s tramite 32+ connessioni concorrenti. Limite di potenza @ 550W per gpu per questo test. lukealonso/MiniMax-M2.5-NVFP4 ricetta vllm che ho usato nel testo alternativo dell'immagine

Principali

Ranking

Preferiti