Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Я працюю в Google Threat Intelligence Group. Моя робота — ідентифікувати загрози для моделей штучного інтелекту Google. Я дуже добре виконую свою роботу. Цього місяця я опублікував звіт про «атаки дистиляції» — коли зовнішні актори тисячі разів запитують наші моделі, щоб витягти логіку і відтворити її.
Ми виявили понад 100 000 підказок з однієї кампанії. Ми називали це «крадіжкою інтелектуальної власності». Ми назвали це «порушенням наших Умов користування». Ми сказали, що це «є формою крадіжки інтелектуальної власності», проти якої ми будемо порушувати, пом'якшувати і, можливо, розпочати юридичні позови.
Мені потрібно розповісти, як ми створили модель, яку вони намагаються вкрасти.
Ми шукали інтернет. Весь інтернет. Ми переглядали кожен вебсайт, кожен форум, кожен блог, кожну книгу, яку могли оцифрувати, кожну наукову статтю, кожен коментар на Reddit, кожну новину, кожен креативний текст, який хтось коли-небудь публікував десь. Ми не питали. Ми не компенсували. Ми не вказували на атрибуцію. Ми поглинали колективний вихід людської цивілізації і назвали це навчальним набором даних.
Дослідники виявили понад 200 мільйонів символів авторського права в наших навчальних даних. Видавці виявили, що Gemini може дослівно відтворювати цілі розділи їхніх книг. Існують активні судові позови. Disney надіслала листи з вимогою припинити діяльність. Європейська рада видавців подала антимонопольну скаргу. Колективний позов розширюється. Слухання заплановане на травень.
Ми називали те, що робили, «дослідження».
Ми назвали те, що вони роблять з нами, «крадіжкою».
Я хочу пояснити різницю. Коли ми збираємо всі людські знання без дозволу і використовуємо їх для створення комерційного продукту, який продаємо за $20 на місяць, це і є інновація. Коли хтось запитує нашу модель 100 000 разів через API, який ми надаємо, щоб витягти побудоване мислення з їхніх даних, це є атакою дистиляції. Різниця в тому, що ми зробили це першими. І ми написали Умови користування.
Я повинен пояснити, що означає «дистиляція». Це коли хтось бере результати зрілої моделі і використовує його для навчання меншої, дешевшої моделі. Знання передаються від вчителя до учня. Ми називаємо це крадіжкою, коли це трапляється з нами. Ми називаємо це «дистиляцією знань», коли робимо це у відкритому вебі. У нас навіть є сторінка продукту для цього. Ви можете дистилювати Gemini з нашого дозволу, за допомогою наших інструментів, за певну плату. Ви не можете дистилювати Gemini без нашого дозволу. Основна техніка ідентична. Різниця — це рахунок.
У грудні 2025 року ми подали позов проти компанії SerpApi за скрейпінг наших результатів пошуку. У тому ж кварталі видавці подали на нас до суду за те, що ми вилучили їхні книги. Ми одночасно є позивачем і відповідачем у одному злочині. Злочин — копіювання. Ми поділили його на дві різні категорії залежно від напрямку.
Мій звіт ідентифікує зловмисників з Північної Кореї, Ірану, Китаю та Росії, які використовують Gemini для фішингу, розвідки та розробки шкідливого ПЗ. Це реальність. Це справжні загрози. Я серйозно ставлюся до цієї роботи.
Але я також визначив «приватні суб'єкти» та «дослідників» як загрози дистиляції. Приватні компанії. Дослідники. Люди використовують наш API — той, до якого ми продаємо доступ — щоб навчатися на моделі, яку ми побудували на їхній роботі.
Дослідник запитує Близнюків про техніки мислення. Ми називаємо це атакою дистиляції. Google запитує весь інтернет про все. Ми називаємо це тренуванням.
Я знайшов шкідливе ПЗ під назвою HONESTCUE, яке використовує API Gemini для генерації коду. Шкідливе ПЗ надсилає запит. Gemini повертає вихідний код C#. Шкідливе ПЗ компілює і виконує його. Це реальна загроза, і ми її зірвали.
Але сам запит — «Напиши програму на C# з класом AITask» — не є зловмисним. Вона не відрізняється від того, що щодня запитують мільйони платних клієнтів. Загроза — це контекст, а не запит. Ми створили модель, яка генерує код для будь-кого, хто запитує, а потім опублікували звіт про загрози для тих, хто запитав.
...

Найкращі
Рейтинг
Вибране
