Chci v tomto tématu trochu pokračovat, což (zatím) mě příliš neznepokojuje. Existují obrovské zásoby soukromých dat, která jsme si vytvořili na různých místech, včetně aplikací pro zasílání zpráv. Skutečnou "killer aplikací" pro Gen AI je je přetvořit je a tato data převést na příjmy.
Například pokud používáte nějaké zabezpečené aplikace pro zasílání zpráv, všimnete si, že jsou velmi užitečné při zálohování historie konverzací, abyste "neztratili data". Vím, že někteří lidé na to opravdu spoléhají, ale také to (náhodou) znamená, že nosíte obrovskou hromadu dat.
Tato data jsou pro reklamní společnosti v současnosti zcela neznámá. Je to cenné? Nevím. Možná už všechno, co z něj lze ziskově vytěžit, existuje na veřejném fóru! Ale jistě to někdo chce zjistit.
Podobně je na vašem počítači nebo telefonu spousta věcí, které "znají" jedna technologická firma nebo druhá, ale možná ne každá technologická firma. Například Google má roky mé pošty a spoustu cloudových dokumentů, ale Meta, Claude a OpenAI ne. Zatím.
Teď nevím, co bude dál. Možná za deset let budeme žít v AI utopii nebo dystopii a obavy z cílených reklam budou už staromódní. Ale pokud uvažujete o dnešních obchodních modelech, využití všech těchto dat je další hranicí.
To vše vyžaduje přesvědčit lidi, aby si lokálně nainstalovali užitečné AI nástroje a dali těmto nástrojům přístup k relevantním datovým úložištěm. Tyto nástroje jsou již dostupné u většiny AI firem a technologické firmy mají "AI strategie" pro své stávající aplikace.
Lidé vám řeknou, že to lze udělat pomocí místních modelů a TEE. Ano, může. Ale aby bylo možné něco užitečného (kromě pomoci s psaním textů a shrnováním věcí), ty nástroje musí dělat věci ve světě. To vytváří především neúmyslné riziko vystavení dat.
Nemluvím (zatím) o tom, že by firmy záměrně zpeněžovaly data. Teď mluvím jen o riziku náhodného (nebo zlomyslného) exfiltrace. Útoky prompt injection, které způsobí, že model přenese soukromá data ven.
První skutečný prompt injection "červ" jsme ještě neviděli. Ale vsadím se, že ano! Bude to vzrušující. Stav techniky v obraně proti tomuto riziku je... Teď jsem docela nadýchaný.
Například naše nejlepší nápady jsou teď "nikdy nedovolit, aby něco překročilo soukromé/veřejné hranice", což není moc užitečné pro mnoho úkolů. Nebo "použít modely k ověření porušení soukromí", což mi připomíná ten příběh Dr. Seusse o králi, který používá kočky k pronásledování myší kradoucích jeho sýr.
Ale tato obava je druhořadá. Skutečné riziko je, že firmy, které to budují, to *záměrně* upraví, aby z toho získaly poznatky. Zvažte agenta, který za vás vyhledává pomocí otevřeného vyhledávače. Posílání soukromých postřehů činí vyhledávání užitečnějším!
Takže vaše soukromá data říkají lokálnímu/TEE modelu, co se vám líbí. Požádáte agenta, aby hledal produkty. Kolik soukromých informací o vašich preferencích je záměrně spojeno s tímto vyhledáváním?
Odpověď, jak to vidím, je: hodně! Čím více kontextu má vyhledávač o vašich přáních, tím lepší jsou výsledky. A náhodou platí, že tím lepší je cílení a sledování reklam.
Jedna námitka na to je: koho to zajímá! Možná takhle teď svět prostě funguje. Dokonce můžeme vytvořit modely, které vás sledují a inzerují "soukromě", což znamená, že čtou všechna vaše důvěrná data a používají je k prodeji správného mýdla. Je to tak špatné?
Samozřejmě, zároveň budou existovat vlády, které budou chtít přístup k těmto poznatkům. Kdybyste mohli tato data použít k sledování a identifikaci zločinců (nebo potenciálních zločinců) bez doslovného čtení jejich dat, nebyl by to úžasný vyšetřovací nástroj?
Nejde o budoucí obavy jako AGi. Gen AI to všechno zvládne právě teď. Takže firmy dnes všechny pracují na realizaci těchto myšlenek. Vlády (jako EU) již žádají o přístup k modelům, které čtou soukromá data.
Ať už se rozhodneme cokoli, chci, aby lidé dělali tyto volby s otevřenýma očima. Nechci, aby někdo řekl "no, tahle funkce tvrdí, že je soukromá, tak proč tentokrát nekliknout na OK" a pět let důvěrných dat by se dostalo do ingesterního řetězce.
Snažit se, aby se lidé o to zajímali, je jako snažit se donutit teenagera nosit opalovací krém. Všechna rizika zní velmi teoreticky a přínosy jsou v přítomnosti. Jen nechci, abychom se jednoho dne všichni probudili a přáli si, abychom to udělali jinak.
178