Saya ingin melanjutkan sedikit tentang topik ini, yang (sejauh ini) saya lihat sangat sedikit kekhawatiran. Ada banyak penyimpanan data pribadi yang telah kami bangun di berbagai tempat, termasuk aplikasi perpesanan. "Aplikasi pembunuh" nyata untuk Gen AI adalah menelannya dan mengubah data itu menjadi pendapatan.
Misalnya, jika Anda menggunakan beberapa aplikasi perpesanan yang aman, Anda akan melihat bahwa aplikasi tersebut sangat membantu dalam mencadangkan riwayat percakapan Anda sehingga "Anda tidak kehilangan data". Saya tahu beberapa orang benar-benar mengandalkan ini, tetapi juga itu (secara kebetulan) berarti Anda telah membawa tumpukan data yang sangat besar.
Data itu saat ini sepenuhnya gelap bagi perusahaan iklan. Apakah itu berharga? Saya tidak tahu. Mungkin segala sesuatu yang dapat diekstraksi secara menguntungkan darinya sudah ada di forum publik! Tapi pasti ada yang ingin mengetahuinya.
Demikian pula, ada banyak hal di komputer atau ponsel Anda yang "diketahui" oleh satu perusahaan teknologi atau lainnya, tetapi mungkin tidak oleh setiap perusahaan teknologi. Misalnya, Google memiliki email saya selama bertahun-tahun dan banyak dokumen cloud, tetapi Meta dan Claude dan OpenAI tidak. Belum.
Sekarang saya tidak tahu masa depan. Mungkin dalam sepuluh tahun kita hidup dalam utopia atau distopia AI dan kekhawatiran tentang iklan yang ditargetkan sangat aneh. Tetapi jika Anda mempertimbangkan model bisnis saat ini, mengeksploitasi semua data itu adalah perbatasan berikutnya.
Semua ini membutuhkan meyakinkan orang untuk menginstal alat AI yang bermanfaat secara lokal dan memberi alat tersebut akses ke penyimpanan data yang relevan. Alat-alat tersebut sudah tersedia dari sebagian besar perusahaan AI, dan perusahaan teknologi semuanya memiliki "strategi AI" untuk aplikasi mereka yang ada.
Sekarang orang-orang akan memberi tahu Anda bahwa ini dapat dilakukan dengan menggunakan model lokal dan TEE. Ya bisa. Tetapi untuk melakukan sesuatu yang berguna (selain membantu Anda menulis teks dan meringkas sesuatu) alat-alat itu perlu melakukan hal-hal di dunia. Itu menciptakan, pertama, risiko paparan data yang tidak disengaja.
Saya tidak berbicara (belum) tentang perusahaan yang sengaja mencoba memonetisasi data. Saat ini saya hanya berbicara tentang risiko eksfiltrasi yang tidak disengaja (atau berbahaya). Serangan injeksi prompt yang menyebabkan model menyalurkan data pribadi ke luar.
Kami belum melihat "cacing" injeksi prompt dunia nyata pertama. Tapi saya yakin kita akan melakukannya! Ini akan mengasyikkan. Keadaan seni dalam mempertahankan diri dari risiko ini adalah... agak halus sekarang.
Misalnya, ide terbaik kami saat ini adalah "jangan pernah membiarkan apa pun melewati batas pribadi/publik" yang tidak terlalu berguna untuk banyak tugas. Atau "gunakan model untuk memeriksa pelanggaran privasi" yang mengingatkan saya pada cerita Dr. Seuss tentang raja yang menggunakan kucing untuk mengejar tikus yang mencuri kejunya.
Tapi kekhawatiran itu sekunder. Risiko sebenarnya adalah bahwa perusahaan yang membangun barang ini akan *sengaja* merekayasanya untuk mengekstrak wawasan. Pertimbangkan agen yang melakukan pencarian untuk Anda, menggunakan mesin pencari terbuka. Mengirim wawasan pribadi membuat pencarian lebih berguna!
Jadi data pribadi Anda memberi tahu model lokal/TEE apa yang Anda sukai. Anda meminta agen untuk mencari produk. Berapa banyak informasi pribadi tentang preferensi Anda yang menyertai pencarian itu, dengan sengaja?
Jawabannya, sejauh yang saya lihat, adalah: banyak! Semakin banyak konteks mesin pencari tentang keinginan Anda, semakin baik hasilnya. Dan secara kebetulan, semakin baik penargetan dan pelacakan iklan.
Satu bantahan untuk ini adalah: siapa yang peduli! Mungkin begitulah cara dunia akan bekerja sekarang. Kami bahkan dapat membuat model yang melacak dan mengiklankan kepada Anda "secara pribadi" yang berarti mereka membaca semua data rahasia Anda dan hanya menggunakannya untuk menjual sabun yang tepat kepada Anda. Apakah itu sangat buruk?
Tentu saja, pada saat yang sama, akan ada pemerintah yang menginginkan akses ke wawasan tersebut. Jika Anda dapat menggunakan data ini untuk melacak dan mengidentifikasi penjahat (atau penjahat potensial) tanpa benar-benar membaca data mereka, bukankah itu akan menjadi alat investigasi yang luar biasa?
Ini bukan masalah masa depan seperti AGi. Gen AI dapat melakukan semua ini sekarang. Jadi semua perusahaan bekerja untuk mengimplementasikan ide-ide ini hari ini. Pemerintah (seperti UE) sudah meminta akses ke model yang membaca data pribadi.
Apa pun yang kita pilih untuk dilakukan, saya ingin orang membuat pilihan itu dengan mata terbuka. Saya tidak ingin ada yang mengatakan "oh, yah, fitur ini mengklaim bersifat pribadi jadi mengapa tidak mengklik Ok ini satu kali" dan lima tahun data rahasia mengalir ke pipeline penyerapan.
Mencoba membuat orang peduli tentang hal ini seperti mencoba membuat seorang remaja memakai tabir surya. Semua risiko terdengar sangat teoretis, dan manfaatnya semuanya ada di masa sekarang. Saya hanya tidak ingin kita semua bangun suatu hari dan berharap kita melakukan hal-hal yang berbeda.
190