Nvidia تشتري Groq لسببين في رأيي.   1) الاستدلال هو التفكيك إلى التعبئة المسبقة وفك الترميز. تتمتع معماريات SRAM بمزايا فريدة في فك الترميز لأحمال العمل حيث يكون الأداء يعتمد أساسا على عرض النطاق الترددي للذاكرة. يجب أن تمنح روبين CPX وروبين والنسخة المفترضة "Rubin SRAM" المستمدة من Groq القدرة على مزج الشرائح لتحقيق التوازن الأمثل بين الأداء والتكلفة لكل عبء عمل. تم تحسين روبين CPX لنوافذ السياق الضخمة أثناء التعبئة المسبقة نتيجة لسعة الذاكرة العالية جدا مع ذاكرة GDDR ذات النطاق الترددي المنخفض نسبيا. روبين هو الحصان العامل الرئيسي للتدريب وأحمال العمل عالية الكثافة والاستدلالية الدفعية، حيث تحقق ذاكرة HBM DRAM التوازن بين عرض النطاق الترددي للذاكرة والسعة. تم تحسين "ذاكرة روبين SRAM" المستمدة من Groq لأحمال العمل الاستدلالية الوكلنية ذات الكمون الفائق المنخفض نتيجة لعرض النطاق الترددي العالي جدا للذاكرة في SRAM على حساب سعة ذاكرة أقل. في الحالة الأخيرة، من المحتمل استخدام CPX أو روبين العادي للتعبئة المسبقة.   2) كان واضحا منذ فترة طويلة أن بنى SRAM يمكن أن تصل إلى مقاييس الرموز في الثانية أعلى بكثير من وحدات معالجة الرسوميات أو وحدات معالجة الرسومات أو أي ASIC رأيناها حتى الآن. زمن استجابة منخفض جدا لكل مستخدم على حساب معدل النقل لكل دولار. قبل 18 شهرا كان من غير الواضح ما إذا كان المستخدمون النهائيون مستعدين للدفع مقابل هذه السرعة (حيث أن SRAM أغلى لكل رمز بسبب حجم دفعات أصغر بكثير). من الواضح الآن من نتائج Cerebras وGroq الأخيرة أن المستخدمين مستعدون للدفع مقابل السرعة.   يزيد من ثقتي بأن جميع أنظمة ASIC باستثناء TPU وAI5 وTrainium ستلغي في النهاية. حظا موفقا في المنافسة مع نسخ روبين الثلاثة والعديد من شرائح الشبكات المرتبطة بها. مع ذلك، يبدو أن ASIC من OpenAI سيكون جيدا بشكل مفاجئ (أفضل بكثير من ASICs من Meta وMicrosoft).   دعونا نرى ماذا تفعل AMD. إنتل تسير بالفعل في هذا الاتجاه (لديهم وحدة تخزين محسنة للتعبئة مسبقا واشتروا SambaNova، التي كانت أضعف منافس لذاكرة SRAM). من المضحك أن ميتا اشترت ريفوس. وسيريبراس، حيث أنا متحيز، الآن في موقع مثير للاهتمام واستراتيجي للغاية كآخر لاعب مستقل (حسب علم الجمهور) في SRAM كان متقدما على Groq في جميع المعايير العامة. ومع ذلك، كانت بنية الرفوف "متعددة الرقائق" في Groq أسهل بكثير في الدمج مع حزمة الشبكات من Nvidia وربما حتى داخل رف واحد، بينما WSE الخاص ب Cerebras كان يكاد يكون رفا مستقلا.
للتوضيح وكما أشار البعض في الردود، يجب أن أشير إلى أن Nvidia لا تستحوذ فعليا على Grok. إنها اتفاقية ترخيص غير حصرية مع انضمام بعض مهندسي Grok إلى Nvidia. ستواصل Grok تشغيل أعمالها السحابية كشركة مستقلة تمثل فعليا منافسا ل Nvidia وعملائها، سواء في مجال التكبير الفائق أو النيوكلاود. الإنترنت يجب أن يكون رائعا لمستخدمي الذكاء الاصطناعي. المزيد من المنافسة، المزيد من الرموز. عيد ميلاد مجيد وهدايا للجميع.
‏‎120‏