Nvidia a plătit de 3 ori evaluarea din septembrie a Groq pentru a o achiziționa. Acest lucru este strategic nuclear. Fiecare laborator AI depindea de GPU, ceea ce crea un risc masiv de concentrare. Google s-a eliberat de TPU-urile pentru uz intern, demonstrând că narațiunea "Nvidia sau nimic" era falsă. Acest lucru nu a demonstrat doar fezabilitatea tehnică, ci a arătat că șanțul Nvidia era mai puțin adânc decât credeau piețele. Când un hyperscaler reușește să construiască siliciu personalizat, fiecare cumpărător sofisticat începe să facă calcule de tipul "ar trebui să ne construim propriile calcule?". Aceasta scade TAM-ul Nvidia. Jonathan Ross (fondatorul Groq) este inventatorul TPU. A înțeles principiile arhitecturale care făceau viabilă accelerarea AI non-GPU. Arhitectura lui LPU viza sarcini de inferență acolo unde GPU-urile sunt de fapt supra-inginere. Acest lucru contează pentru că inferența este locul unde se află banii reali pe termen lung. Antrenamentul este un capex de o singură dată, dar inferența este opex recurent care scalează odată cu folosirea. Dacă Groq ar demonstra că LPU-urile pot atinge un raport-preț-performanță competitiv prin inferență, fiecare furnizor de cloud și-ar marca arhitectura cu etichetă albă. Nvidia ar fi fost constrâns în "doar antrenament" în timp ce pierdea fluxul de anuități. Este sigur să vedem acest acord ca pe o asigurare Nvidia împotriva Groq, care permite un întreg ecosistem de alternative Nvidia. Dar ceea ce este și mai interesant este efectul de ordinul doi, blocarea clientului. Acum, Nvidia deține atât standardul existent (CUDA + GPU), cât și cea mai credibilă arhitectură alternativă (LPU-uri). Aceasta este o strategie la nivel Github de către MSFT. Orice laborator AI care evaluează "build vs buy vs alternative vendor" se confruntă acum cu următoarea: - Opțiunea A (GPU-uri Nvidia) - Opțiunea B (LPU-uri Nvidia <> Groq) - Opțiunea C (începe de la zero) Transformând o amenințare competitivă într-un instrument de segmentare a clienților, Jensen este maestrul meseriilor. Acum pot discrimina prețul: clienții premium plătesc pentru GPU-uri, inferența sensibilă la preț este direcționată către LPU-uri, iar Nvidia captează ambele. Dacă Nvidia nu integrează LPU-urile în foaia sa de parcurs, aceasta a fost o mișcare pur defensivă. Dacă îl integrează și încep să ofere pachete "GPU pentru antrenament, LPU pentru inferență", acest lucru devine o achiziție clasică care lărgește șanțul. Cel mai scump lucru din tehnologie nu este construirea viitorului, ci împiedicarea cuiva să-și construiască un viitor fără tine.