$NVDA Rubin obniża koszty tokenów inferencyjnych o nawet 10x i redukuje potrzeby szkoleniowe MoE do ~4x mniej GPU w porównaniu do Blackwell. Każdy pod Rubin zawiera 1 152 GPU w 16 szafach, czyli 72 GPU na szafę.