$NVDA Rubin 将推理令牌成本降低了多达 10 倍,并将 MoE 训练所需的 GPU 数量减少到约 4 倍,较 Blackwell 少。 每个 Rubin 节点包含 1,152 个 GPU,分布在 16 个机架上,每个机架 72 个 GPU。