$NVDA Rubin riduce i costi dei token di inferenza fino a 10 volte e riduce le esigenze di formazione MoE a circa 4 volte meno GPU rispetto a Blackwell. Ogni pod Rubin contiene 1.152 GPU distribuite su 16 rack o 72 GPU per rack.