$NVDA Rubin snižuje náklady inferenčních tokenů až desetkrát a snižuje potřeby MoE tréninku na ~4x méně GPU než Blackwell. Každý Rubin pod obsahuje 1 152 GPU v 16 rackech, tedy 72 GPU v racku.