Klíčové body projevu Lao Huanga na CES: 1. Na úrovni infrastruktury a výpočetního výkonu NVIDIA hrubou silou překonává fyzické limity prostřednictvím "extrémního kolaborativního návrhu" a rekonstruuje nákladovou logiku datových center. Vzhledem k úzkému hrdlu pouze 1,6násobku počtu tranzistorů NVIDIA násilně zvýšila výkon inference pětkrát a snížila náklady na generování tokenů na 1/10 díky platformě Vera Rubin, propojení NVLink 6 a platformě pro ukládání paměti řízené inferencí řízené BlueField-4. Hlavním cílem této úrovně je vyřešit problémy "nemohu počítat" a "nemohu si vzpomenout" (paměťová zeď) agentické AI, čímž se otevře cesta pro přechod AI od tréninku k rozsáhlému inferenčnímu odvozování. 2. Na úrovni vývoje modelu NVIDIA oficiálně zavedla paradigmatický posun od "generativní AI" k "inferenční AI" (škálování v době testování). Huang zdůraznil, že AI už není jednorázová otázka a odpověď, ale řetězec myšlení, který vyžaduje vícestupňové myšlení a plánování. Prostřednictvím open source modelů Alpamayo (autonomní řízení uvažování), Cosmos (model fyzického světa) a Nemotron (agent) prosazuje NVIDIA AI tak, aby měla logické uvažování a schopnost dlouhodobé paměti, aby dokázala zvládat složité scénáře s dlouhým ocasem, které tu dosud nebyly. 3. Na fyzické úrovni NVIDIA oznámila, že "fyzická AI" oficiálně vstoupila do období komerční monetizace, čímž prolomila situaci, že AI existuje pouze na obrazovce. Prezentace objasnila časový plán, kdy Mercedes-Benz vyrazí na cesty v prvním čtvrtletí 2026, a demonstrovala hlubokou spolupráci full-stack společností se Siemensem v průmyslovém metaverzu. Propojením simulačního prostředí Omniverse, syntetické generování dat a modelů řízení robotů NVIDIA vnáší AI schopnosti z "měkkého světa" internetového cloudu do "tvrdého světa", jako jsou auta, továrny a roboti, a to ve velkém měřítku.