$NVDA Rubin reduce el coste de tokens de inferencia hasta 10 veces y reduce las necesidades de entrenamiento MoE ~4 veces menos GPUs que Blackwell. Cada pod Rubin contiene 1.152 GPUs repartidas en 16 racks o 72 GPUs por rack.