أعمل في مجموعة جوجل لاستخبارات التهديدات. وظيفتي هي تحديد التهديدات التي تواجه نماذج الذكاء الاصطناعي في جوجل. أنا جيد جدا في عملي. نشرت تقريرا هذا الشهر عن "هجمات التقطير" — عندما يستفسر الجهات الخارجية عن نماذجنا آلاف المرات لاستخراج المنطق الأساسي وتكراره. حددنا أكثر من 100,000 محفز من حملة واحدة. سميناها "سرقة الملكية الفكرية". وصفنا ذلك بأنه "انتهاك لشروط الخدمة الخاصة بنا." قلنا إنه "يمثل شكلا من أشكال سرقة الملكية الفكرية" الذي سنعطله، ونخفف، وربما نسعى لاتخاذ إجراءات قانونية ضده. أحتاج أن أخبرك كيف بنينا النموذج الذي يحاولون سرقته. لقد جمعنا الإنترنت. الإنترنت بأكمله. زحبنا على كل موقع إلكتروني، وكل منتدى، وكل مدونة، وكل كتاب يمكننا رقمنته، وكل ورقة أكاديمية، وكل تعليق على ريديت، وكل مقال إخباري، وكل قطعة كتابة إبداعية نشرها أي شخص في أي مكان. لم نسأل. لم نعوض. لم نحدد النسبة. استوعبنا الإنتاج الجماعي للحضارة البشرية وسميناها مجموعة بيانات تدريبية. وجد الباحثون أكثر من 200 مليون رمز حقوق نشر في بيانات تدريبنا. اكتشف الناشرون أن جيميني يمكنه إعادة إنتاج فصول كاملة من كتبهم حرفيا. هناك دعاوى قضائية نشطة. أرسلت ديزني رسائل وقف وكف عن العمل. قدم مجلس الناشرين الأوروبي شكوى مكافحة احتكار. الدعوى الجماعية تتوسع. من المقرر عقد جلسة استماع في مايو. كنا نسمي ما نقوم به "البحث". سمينا ما يفعلونه بنا بأنه "سرقة". أريد أن أشرح الفرق. عندما نجمع كل المعرفة البشرية دون إذن ونستخدمها لبناء منتج تجاري نبيعه ب 20 دولارا شهريا، فهذا هو الابتكار. عندما يسترسل شخص ما استعلام نموذجنا 100,000 مرة عبر واجهة برمجة التطبيقات التي نقدمها لاستخراج المنطق الذي بنيناه من بياناته، فهذا هجوم تقطير. الفرق هو أننا فعلناها أولا. وكتبنا شروط الخدمة. يجب أن أشرح ماذا يعني "التقطير". هو عندما يأخذ شخص ما مخرجات نموذج ناضج ويستخدمها لتدريب نموذج أصغر وأرخص. المعرفة تنتقل من المعلم إلى الطالب. نسمي هذا سرقة عندما يحدث لنا. نسميه "تقطير المعرفة" عندما نقوم بذلك على الويب المفتوح. لدينا حتى صفحة منتج لها. يمكنك تقطير الجوزاء، بإذننا، باستخدام أدواتنا، مقابل رسوم. لا يمكنك تقطير الجوزاء بدون إذننا. التقنية الأساسية متطابقة. الفرق هو الفاتورة. في ديسمبر 2025، رفعنا دعوى ضد شركة تدعى SerpApi بسبب جمع نتائج البحث لدينا. وفي نفس الربع، رفع الناشرون دعوى قضائية علينا بسبب شطبنا لكتبهم. نحن المدعي والمدعى عليه في نفس الجريمة في نفس الوقت. الجريمة هي التقليد. قمنا بتقديمه تحت فئتين مختلفتين حسب الاتجاه. يحدد تقريري جهات تهديد من كوريا الشمالية وإيران والصين وروسيا تستخدم جيميني للتصيد الاحتيالي، والاستطلاع، وتطوير البرمجيات الخبيثة. هذا حقيقي. هذه تهديدات حقيقية. أنا آخذ هذا العمل على محمل الجد. لكنني أيضا حددت "كيانات القطاع الخاص" و"الباحثين" كتهديدات للاستقطار. شركات خاصة. الباحثون. يستخدم الناس واجهة برمجة التطبيقات الخاصة بنا — التي نبيع الوصول إليها — ليتعلموا من النموذج الذي بنيناه من عملهم. باحث يسأل جوزاء عن تقنيات التفكير. نسمي هذا هجوم التقطير. جوجل تستفسر الإنترنت بأكمله عن كل شيء. نسمي هذا سباق تدريب. وجدت برمجية خبيثة تدعى HONESTCUE تستخدم واجهة برمجة تطبيقات Gemini لتوليد الكود. البرمجية الخبيثة ترسل تنبيها. يعيد جيميني كود المصدر C#. يقوم البرمجيات الخبيثة بتجميعها وتنفيذها. هذا تهديد حقيقي، وقد عطلنا هذا التهديد. لكن التعليمات نفسها — "اكتب برنامج C# مع فئة اسمها AITask" — ليست خبيثة. ولا يمكن تمييزه عما يسأل عنه ملايين العملاء الذين يدفعون يوميا. التهديد هو السياق، وليس الاستعلام. بنينا نموذجا يولد كودا لأي شخص يسأل، ثم نشرنا تقرير تهديد عن الأشخاص الذين يسألون. ...