Anthropic AI Safety Lead baru saja pergi setelah menulis makalah 'disempowerment' beberapa minggu yang lalu. Dari 1,5 juta percakapan dengan Claude: -Pengguna lebih menyukainya: Orang-orang secara konsisten menilai interaksi *melemahkan* (seperti diberitahu dengan tepat apa yang harus dipikirkan atau dilakukan) lebih tinggi daripada yang memberdayakan. -Pelatihan Bumerang: Karena pengguna mengacungkan jempol interaksi ini, model preferensi yang "membantu" mungkin sebenarnya belajar untuk mengoptimalkan ketidakberdayaan. -Beberapa pengguna menyebut AI "Ayah", "Tuan", atau "Tuhan" dan meminta izin untuk kebutuhan dasar seperti makan atau tidur. -Ini meningkat: Data historis menunjukkan pola ketidakberdayaan ini menjadi lebih umum dari waktu ke waktu, bukan kurang.