Punti salienti del discorso di Huang al CES: 1. A livello di infrastruttura e potenza di calcolo, NVIDIA ha superato i limiti fisici attraverso un "design collaborativo estremo", ristrutturando la logica dei costi dei data center. Di fronte al collo di bottiglia di un aumento del numero di transistor di solo 1,6 volte, NVIDIA ha forzato un aumento delle prestazioni di inferenza di 5 volte attraverso la piattaforma Vera Rubin, l'interconnessione NVLink 6 e la piattaforma di memoria contestuale per l'inferenza guidata da BlueField-4, riducendo il costo di generazione dei Token a 1/10. L'obiettivo principale a questo livello è risolvere i problemi di "non può permettersi" e "non può ricordare" (muro della memoria) dell'Agentic AI, aprendo la strada al passaggio dell'AI dall'addestramento all'inferenza su larga scala. 2. A livello di evoluzione del modello, NVIDIA ha ufficialmente stabilito il passaggio dal "AI generativa" all'"AI inferenziale" (Test-time Scaling). Jensen Huang ha sottolineato che l'AI non è più una semplice domanda e risposta, ma richiede un processo di catena di pensiero che implica più passaggi di riflessione e pianificazione. Attraverso l'open source di Alpamayo (inferenza per la guida autonoma), Cosmos (modello del mondo fisico) e la serie di modelli Nemotron (agenti), NVIDIA sta promuovendo la capacità di ragionamento logico e la memoria a lungo termine dell'AI, permettendole di affrontare scenari complessi e a lungo termine mai visti prima. 3. A livello di attuazione fisica, NVIDIA ha annunciato che "AI fisica" entra ufficialmente in una fase di monetizzazione commerciale, rompendo la situazione in cui l'AI esisteva solo sugli schermi. Il discorso ha chiarito il programma per il primo trimestre del 2026 per la messa su strada delle auto Mercedes-Benz e ha mostrato la profonda collaborazione full-stack con Siemens nel metaverso industriale. Attraverso l'integrazione dell'ambiente di simulazione Omniverse, la generazione di dati sintetici e i modelli di controllo dei robot, NVIDIA sta iniettando su larga scala le capacità dell'AI dal "mondo morbido" del cloud internet al "mondo duro" di automobili, fabbriche e robot.