$NVDA Rubin senkt die Kosten für Inferenz-Token um bis zu 10x und reduziert die MoE-Trainingsanforderungen auf ~4x weniger GPUs im Vergleich zu Blackwell. Jeder Rubin-Pod enthält 1.152 GPUs auf 16 Racks oder 72 GPUs pro Rack.