$NVDA Rubin reduce los costos de inferencia de tokens hasta en 10x y reduce las necesidades de entrenamiento de MoE a ~4x menos GPUs en comparación con Blackwell. Cada pod Rubin contiene 1,152 GPUs distribuidos en 16 racks o 72 GPUs por rack.