Na GTC Nvidii, Jensen nazywa to „prawdopodobnie najważniejszym wykresem dla przyszłości fabryk AI”. Oś Y to „Przepustowość” (całkowita objętość), podczas gdy oś X to „Szybkość tokenów” (więcej tokenów na sekundę = więcej interaktywności dla użytkownika + więcej kontekstu + więcej rozumowania). Firmy wyceniają i sprzedają oferty tokenów na podstawie tych dwóch zmiennych, które są w napięciu. Darmowy poziom zazwyczaj ma wysoką przepustowość, ale niższą szybkość tokenów. Tymczasem najdroższy poziom miałby niższą przepustowość, ale tokeny o wysokiej wartości (np. badania, kodowanie). Wyzwanie Nvidii polega na zbudowaniu systemów, które podniosą całą linię w górę i w prawo. Jensen mówi, że architektura Vera Rubin poprawia możliwości przychodowe 5x w porównaniu do Blackwell. Następnie, jeśli dodasz Groq do Vera Rubin, ta możliwość przychodowa wzrasta 10x w porównaniu do Blackwell (Groq przydatny dla tokenów o wyższej wartości).