$NVDA Rubin réduit les coûts des tokens d'inférence jusqu'à 10x et diminue les besoins en formation MoE à ~4x moins de GPU par rapport à Blackwell. Chaque pod Rubin contient 1 152 GPU répartis sur 16 racks ou 72 GPU par rack.