أعتقد أن هذا رأي استفزازي وفكرة جيدة، لكنني أردت أن أعمل على المنطق قليلا. اليوم، معظم أدوات الذكاء الاصطناعي تعمل على السحابة. في كل مرة تطلب من نموذج كتابة أو تلخيص أو ترجمة أو تحليل شيء ما، يصل هذا الطلب إلى وحدة معالجة رسومات في مركز بيانات. المزيد من المستخدمين → المزيد من الاستعلامات → المزيد من وحدات معالجة الرسوميات → المزيد من مراكز البيانات → المزيد من خطوط الكهرباء، المحولات، المحطات الفرعية → المزيد من التوليد، إلخ. هذا هو المحور الأساسي وراء طفرة رأس المال الحالي في أجهزة الذكاء الاصطناعي + مراكز البيانات. الاستدلال المفيد على الجهاز يعطل تلك السلسلة الخطية. إذا كان نموذج متعدد المليارات من المعلمات فعالا بما يكفي ليعمل على الشريحة العصبية داخل هاتفك أو حاسوبك المحمول أو سيارتك أو سماعة الرأس، فإن جزءا كبيرا من المهام اليومية لا يجب أن يغادر الجهاز أبدا. فكر في طلبات بسيطة ولكن ذات حجم عالي: إكمال تلقائي، صياغة البريد الإلكتروني، نسخ صوتي، تلخيص، التعرف على الصور البسيط. هذه بالضبط هي الاستعلامات العامة عالية الحجم ومنخفضة التعقيد التي من المرجح أن تهيمن على الاستخدام. فحص سريع لما يمكن أن يتغير: افتراضات بسيطة - مرن كما تشاء. -1B مستخدم × 50 استعلام/يوم × ~$0.002/استعلام × 365 يوما = ~~$35 مليار سنويا في تكلفة الاستدلال السحابي. -إذا تم نقل 30٪ من ذلك إلى الجهاز، فهذا يعني ~11 مليار دولار+ من الطلب السنوي على السحابة الذي لا يتحقق أبدا. -التكلفة الحدية لكل استعلام محلي هي فعليا ~$0 بمجرد شحن الجهاز. تحذيرات عادية: الأجهزة في طريقها لكنها لا تزال بحاجة إلى زيادة الذاكرة وعرض النطاق الترددي وما إلى ذلك. لكن، نموذج 3–7 مليار معامل يعمل على شريحة الهاتف العصبية (حوالي 10–45 "TOPS" اليوم، و60+ متوقع بحلول 2027) يمكنه التعامل مع تلك المهام عالية الحجم ومنخفضة التعقيد محليا. لا تحتاج إلى نماذج متقدمة لكل محفز. لا يزال Cloud مهما، لأكون واضحا جدا. نماذج التدريب الحدودية، التفكير الثقيل طويل السياق، أعباء عمل المؤسسات الكبيرة، تنسيق الوكلاء المتعدد – كل ذلك لا يزال أكثر ملاءمة لمراكز البيانات الكبيرة والمركزية. التحول الرئيسي هو أن سلسلة المنطق لم تعد "كل مستخدم جديد = يجب أن أضيف المزيد من وحدات معالجة الرسوميات والمزيد من سعة مركز البيانات الجيجاواتية." هنا لا يعرف حجة جيفون حول المفارقة وما إذا كانت تدفع المزيد من استخدام الذكاء الاصطناعي وتدفع المستخدمين للبحث عن تعليمات أكثر تعقيدا، مما يعوض بعض هذا الوضع بالنسبة لنقطة آشاي، فإن طفرة رأس المال لا 'تنكسر' بالكامل، لكن مسار شدتها الحالي من المرجح أن يكون معدلا. نقل حتى 5–30٪ من أعباء العمل الاستدلالية من السحابة إلى الجهاز على نطاق اليوم يمكن أن يكون ذا معنى. المشاكل الصعبة تبقى مركزية في السحابة. لكن "الذكاء الاصطناعي اليومي" يصبح ميزة في الأجهزة التي تملكها بالفعل مقابل أداة مقيسة يتم استئجارها بواسطة الاستعلام.