$NVDA Rubin reduz os custos de token de inferência em até 10x e corta as necessidades de treinamento de MoE para ~4x menos GPUs em comparação com Blackwell. Cada pod Rubin contém 1.152 GPUs distribuídas em 16 racks ou 72 GPUs por rack.