Na GTC da Nvidia, Jensen chama isso de "provavelmente o gráfico mais importante para o futuro das fábricas de IA". O eixo Y é "Throughput" (volume total), enquanto o eixo X é "Token Speed" (mais tokens por segundo = mais interatividade para um usuário + mais contexto + mais raciocínio). As empresas comercializam e precificam ofertas de tokens com base nessas duas variáveis, que estão em tensão. Um nível gratuito normalmente tem alta capacidade de processamento, mas baixa velocidade de token. Enquanto isso, o nível mais caro teria menor capacidade de processamento, mas tokens de alto valor (por exemplo, pesquisa, codificação). O desafio da Nvidia é construir sistemas que elevem toda a linha para cima e para a direita. Jensen diz que a arquitetura Vera Rubin melhora a oportunidade de receita em 5x em comparação com a Blackwell. Então, se você adicionar Groq à Vera Rubin, essa oportunidade de receita aumenta em 10x em comparação com a Blackwell (Groq útil para os tokens de maior valor).