3 COSE CHE CONTANO DELLA FUSIONE TRA $NVDA E GROQ 1. Si trattava di possedere l'economia dell'inferenza, non di risolvere un gap nei chip Nvidia non ha acquisito Groq perché era in ritardo sui chip, dato che Nvidia già domina il training e la maggior parte dell'inferenza e il suo piano (GB300, Rubin) continua a ridurre il costo per token mentre espande le prestazioni più velocemente di quasi chiunque altro. Il training è un evento una tantum mentre l'inferenza è dove vive il nuovo modello di business dell'IA, quindi man mano che l'IA si sposta in prodotti reali, il denaro si sposta verso chi controlla il runtime. 2. Il futuro in cui l'inferenza sfuggiva a Nvidia è stato appena assorbito Groq era una delle poche prove credibili che l'inferenza sensibile alla latenza potesse eventualmente spostarsi dalle GPU e nel tempo questo avrebbe eroso lo status "inevitabile" di Nvidia. Il rischio è stato amplificato dal fondatore di Groq, Jonathan Ross, che in precedenza aveva costruito TPU presso $GOOGL e ha già dimostrato che il silicio personalizzato può competere in carichi di lavoro reali. Questo accordo chiude quella porta prima che potesse scalare. 3. L'inferenza deterministica era il livello mancante Le GPU eccellono in flessibilità e scalabilità, ma non sono mai state progettate per garantire tempi di risposta perfettamente coerenti. Questo è importante perché l'IA nel mondo reale si interrompe quando ci sono jitter di latenza: gli assistenti vocali si fermano, la traduzione in tempo reale ritarda, i flussi di lavoro agentici accumulano ritardi. Groq ha risolto questo progettando attorno a grandi quantità di SRAM mantenendo i dati vicini al processore e fornendo risposte rapide ogni volta. Questo ha reso Groq particolarmente adatta per l'IA in tempo reale dove la latenza conta più del throughput massimo. A questo punto, è difficile sostenere che Nvidia venda solo chip quando sta chiaramente costruendo la piattaforma che possiede il training, il networking e ora l'inferenza in tempo reale. $20B oggi per evitare un problema da $200B in seguito.