Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
3 LUCRURI CARE CONTEAZĂ LA AFACEREA $NVDA + GROQ
1. Era vorba despre a deține economia inferenței, nu despre a corecta un gol de cip
Nvidia nu a angajat Groq pentru că era în urmă la capitolul cipuri, întrucât Nvidia deja domină antrenamentul și majoritatea inferențelor, iar foaia sa de parcurs (GB300, Rubin) continuă să reducă costul per token și să crească performanța mai rapid decât aproape oricine altcineva. Antrenamentul este un eveniment unic, în timp ce inferența este locul unde se află noul model de afaceri AI, astfel încât, pe măsură ce AI trece la produse reale, banii se mută la cine controlează runtime-ul.
2. Viitorul în care concluzia scapă, Nvidia tocmai a fost absorbit
Groq a fost una dintre puținele dovezi credibile că inferența sensibilă la latență ar putea în cele din urmă să se mute de pe plăci video și, în timp, acest lucru ar fi afectat treptat statutul de "inevitabil" al Nvidia. Riscul a fost amplificat de fondatorul Groq, Jonathan Ross, care anterior a construit TPU-uri la $GOOGL și a demonstrat deja că siliciul personalizat poate concura în sarcini reale. Această tranzacție închide acea ușă înainte să se poată scala.
3. Inferența deterministă era stratul lipsă
GPU-urile excelează la flexibilitate și scalare, dar nu au fost niciodată proiectate să garanteze timpi de răspuns perfect constanți. Asta contează pentru că AI-ul din lumea reală se strică când latența tremură: asistenții vocali se opresc, traducerea live întârzie, fluxurile de lucru agențice acumulează întârzieri. Groq a rezolvat acest lucru proiectând în jurul unor cantități mari de SRAM, păstrând datele aproape de procesor și oferind răspunsuri rapide de fiecare dată. Acest lucru a făcut ca Groq să fie unic potrivit pentru AI în timp real, unde latența contează mai mult decât debitul maxim.
În acest moment, este greu de susținut că Nvidia vinde doar cipuri când construiește clar platforma care deține instruirea, rețelistica și acum inferența în timp real.
20 de miliarde de dolari astăzi ca să evităm o problemă de 200 de miliarde mai târziu.


Limită superioară
Clasament
Favorite
