$NVDA Rubin reduz o custo dos tokens de inferência em até 10 vezes e reduz as necessidades de treinamento do MoE para ~4x menos GPUs em comparação com a Blackwell. Cada pod Rubin contém 1.152 GPUs distribuídas em 16 racks ou 72 GPUs por rack.