Pontos principais da palestra de Huang no CES: 1. No que diz respeito à infraestrutura e à camada de computação, a NVIDIA quebrou violentamente os limites físicos através do "design colaborativo extremo", reestruturando a lógica de custos dos data centers. Diante do gargalo de um aumento de apenas 1,6 vezes no número de transistores, a NVIDIA forçou um aumento de 5 vezes no desempenho de inferência através da plataforma Vera Rubin, da interconexão NVLink 6 e da plataforma de armazenamento de memória de contexto de inferência impulsionada pelo BlueField-4, reduzindo o custo de geração de Tokens para 1/10. O objetivo central neste nível é resolver os problemas de "não conseguir calcular" e "não conseguir lembrar" (limite de memória) da AI Agente (Agentic AI), pavimentando o caminho para a transição da AI de treinamento para inferência em larga escala. 2. No que diz respeito à evolução do modelo, a NVIDIA estabeleceu oficialmente a transição do paradigma de "AI generativa" para "AI de inferência" (Test-time Scaling). Jensen Huang enfatizou que a AI não é mais uma simples pergunta e resposta, mas sim um processo de cadeia de pensamento que requer raciocínio e planejamento em múltiplas etapas. Através da abertura do Alpamayo (inferência de condução autônoma), Cosmos (modelo do mundo físico) e da série de modelos Nemotron (agentes), a NVIDIA está promovendo a capacidade de raciocínio lógico e memória de longo prazo na AI, permitindo que ela lide com cenários complexos de cauda longa que nunca viu antes. 3. No que diz respeito à implementação física, a NVIDIA anunciou que a "AI física" entrou oficialmente na fase de monetização comercial, quebrando a situação em que a AI existia apenas nas telas. A palestra definiu claramente o cronograma para a Mercedes-Benz colocar veículos reais na estrada no Q1 de 2026 e apresentou a colaboração profunda e de pilha completa com a Siemens no metaverso industrial. Ao conectar o ambiente de simulação Omniverse, a geração de dados sintéticos e os modelos de controle robótico, a NVIDIA está injetando em grande escala a capacidade de AI do "mundo suave" da nuvem da internet para o "mundo duro" de automóveis, fábricas e robôs.