$NVDA + GROQ ANLAŞMASINDA ÖNEMLI 3 ŞEY 1. Bu, çip boşluğunu düzeltmek değil, çıkarım ekonomisine sahiplenmekle ilgiliydi Nvidia, Groq'u işe almadı çünkü çip konusunda gerideydi; çünkü Nvidia zaten eğitimde hakim ve çoğu çıkarım ile yol haritası (GB300, Rubin) tokenlık maliyeti aşağı düşürürken performansı neredeyse herkesten daha hızlı artırıyor. Eğitim tek seferlik bir olaydır, çıkarım ise yeni yapay zeka iş modelinin yaşadığı yerdir; yapay zeka gerçek ürünlere geçtikçe para çalışma zamanını kontrol edenlere geçer. 2. Çıkarımın kaçtığı gelecek Nvidia'nın yeni emildiği Groq, gecikmeye duyarlı çıkarımın sonunda GPU'lardan ayrılabileceğine ve zamanla bunun Nvidia'nın "kaçınılmaz" statüsünü azaltabileceğine dair az sayıdaki güvenilir kanıtlardan biriydi. Risk, daha önce $GOOGL'de TPU'lar üretmiş ve özel silikonların gerçek iş yüklerinde rekabet edebileceğini kanıtlayan Groq'un kurucusu Jonathan Ross tarafından daha da artırılmıştı. Bu anlaşma, ölçeklenmeden o kapıyı kapatıyor. 3. Deterministik çıkarım eksik katmandı GPU'lar esneklik ve ölçek açısından üstün ama hiçbir zaman mükemmel tutarlı yanıt sürelerini garanti edecek şekilde tasarlanmadılar. Bu önemli çünkü gerçek dünya yapay zekası gecikme bozulduğunda bozulur: sesli asistanlar duraklar, canlı çeviri gecikmeleri, ajanik iş akışları gecikmeleri artırır. Groq bu sorunu, verileri işlemciye yakın tutarak ve her seferinde hızlı yanıtlar vererek büyük miktarda SRAM etrafında tasarlayarak çözdü. Bu da Groq'u gerçek zamanlı yapay zeka için benzersiz bir şekilde uygun kılıyor; burada gecikme zirve verimlilikten daha önemliydi. Şu noktada, Nvidia'nın sadece çip sattığını iddia etmek zor, oysa açıkça eğitim, ağ ve gerçek zamanlı çıkarım sağlayan bir platformu inşa ediyor. Bugün 20 milyar dolar ödedim, ileride 200 milyar dolarlık bir sorun yaşamamak için.