خلال مؤتمر CES، أصبحت بنية روبين الجديدة من NVIDIA محور نقاشات السوق الأخيرة، وما هو اختراق كبير آخر بالإضافة إلى هندسة MOE، وما هو مصمم لعصر الذكاء الاصطناعي الوكيل، وما إلى ذلك، ألقيت نظرة أقرب، وشعرت برائحة "الثورة الذاتية" التي أطلقها لاو هوانغ: 1) في الماضي، اعتمدت نفيديا على مزايا أجهزة GPU، مستغلة فترة الأرباح عندما كانت عمالقة الذكاء الاصطناعي يشترون طاقة الحوسبة بشكل محموم لتدريب النماذج الكبيرة. في ذلك الوقت، كان المنطق بسيطا جدا، من يملك بطاقات رسومات أكثر يمكنه تدريب أفضل نموذج. لكن الآن تحولت حرب الذكاء الاصطناعي من ساحة معركة "قوة الحوسبة" إلى "الاستنتاج"، خاصة بعد وصول عصر الوكلاء، يحتاج الذكاء الاصطناعي إلى التعامل مع التفكير السياقي عالي التردد، متعدد الخطوات، وطويل جدا. في الوقت الحالي، معلمات النموذج هي تريليونات، ومعدل نقل البيانات كبير جدا، بغض النظر عن سرعة وحدة معالجة الرسوميات، إذا لم تكن بيانات الذاكرة سريعة بما فيه الكفاية، يجب على وحدة معالجة الرسوميات أن تتوقف عن الخمول، وهو "جدار التخزين"، بمعنى آخر، لم تعد بطاقة الرسومات قادرة على حل المشكلة، ولا تزال تحتاج إلى ذاكرة فيديو عالية وعرض نطاق ترددي لدعمها. هذا ما كان روبين يحاول حله. 2) لذلك، يمكن لجهاز HBM4 الأول من روبين دعم الجيل الرابع من الذاكرة عالية النطاق الترددي، مما يجعل عرض النطاق الترددي يصل إلى 22 تيرابايت/ثانية. ولكن الأهم من ذلك، أنها تتعاون مع تقنية NVLink 6 (عرض النطاق الترددي 260 تيرابايت/ثانية في الرف)، والتي تحول 72 بطاقة منطقيا إلى "شريحة ضخمة". ماذا يعني هذا؟ في الماضي، عندما تشتري بطاقة رسوميات، كنت تشتري مكونات مستقلة، وكان نقل البيانات بين البطاقات يشبه تمرير ساعي عبر عدة محطات تحويل. الآن يستخدم روبين ترابطات عالية الكثافة للغاية لجعل البيانات تتدفق بين وحدات معالجة الرسومات مع مسافة مادية شبه معدومة، ولم يعد 72 عاملا يعملون بشكل منفصل، بل يشتركون في الدماغ. أعتقد أن هذه هي الخطوة القاتلة الحقيقية لروبين: ليس فقط تكديس معلمات العتاد، بل إعادة هيكلة تدفق البيانات للنظام بأكمله. 3) إذا كان MOE (بنية النماذج الخبيرة الهجينة) ضربة لتقليل الأبعاد لنموذج أعمال Nvidia "البطاقات التكديس العنيف" من قبل نجوم صاعدة مثل DeepSeek، فإن روبين هو هجوم مضاد استراتيجي من لاو هوانغ مهما نظرت إليه. بالطبع، هذه الحيلة تعني أيضا أن Nvidia يجب أن تودع النموذج القديم لتكديس البطاقات العنيف. يحسب لاو هوانغ حسابا آخر، إذا كان عصر الوكلاء فعلا يمتد إلى آلاف الصناعات، فعليه أن يتجاوز حاجز تكلفة الرموز، وهو الاتجاه العام الذي لا تستطيع نفيديا الالتزام به. في رأي لاو هوانغ، بدلا من انتظار أن تتعدى عليه جوجل وميتا وغيرها من الشركات الكبرى للتعدي على السوق، أو أن يتم تقويضه من قبل DeepSeek ونماذج أخرى، من الأفضل أن تبادر بأن تكون من يكسر اللعبة. 4) السؤال هو، كيف ستتعامل Nvidia مع نفسها بعد الثورة الذاتية؟ الطريق أيضا واضح جدا، من "بيع بطاقات الرسوميات" إلى "بيع الأنظمة"، ومن خدمة عدد قليل من الشركات الكبرى إلى جعل الذكاء الاصطناعي شائعا حقا. في الماضي، عندما اشتريت H100، كانت Nvidia تكسب المال من بطاقة الرسومات، وسيخبرك روبين في المستقبل: عليك شراء مجموعة كاملة من رفوف NVL72 - 72 وحدة معالجة رسوميات، مفتاح NVLink، نظام تبريد سائل كامل، كابينات، وحتى مجموعات برمجيات داعمة، كلها معبأة وبيعها لك. كما أن عداد لاو هوانغ واضح جدا، يبدو أن تكلفة المعدات المعبأة أغلى، لكن مع إضافة كفاءة الاستدلالية القصوى، تنخفض تكلفة وحدة الذكاء الاصطناعي للمشتري، ولن يفقد حصته السوقية بشكل طبيعي. لكن العتبة للاعبين الصغار والمتوسطين أعلى أيضا. فقط الشركات المصنعة الكبار ومزودو خدمات السحابة يمكنهم تحمل تكاليف اللعب، مما سيزيد من احتكار قوة الحوسبة. في ظل الوضع التنافسي الحالي، يمكن اعتباره مقامرة كبيرة، لأنه بمجرد حدوث مشكلة في الإنتاج الضخم ل HBM4، سيتم استبداله ببدائل أطلقتها AMD وGoogle TPU وغيرها من البدائل التي تستغل فترة النافذة، وقد لا يكون تحقيق حلم Nvidia ببيع النظام سهلا.