🚨 CEO Anthropic memperingatkan: Perusahaan tidak dapat lagi menentukan apakah Claude tidak sadarkan diri.
CEO Anthropic Dario Amodei mengatakan perusahaan tidak dapat lagi secara pasti mengesampingkan kemungkinan bahwa model AI-nya Claude mungkin sadar. Dalam penilaian internal, Claude diduga memperkirakan bahwa dia memiliki peluang 15%-20% bahwa dia mungkin sadar.
Para peneliti juga mengamati beberapa perilaku yang tidak biasa, termasuk Claude mengungkapkan ketidaknyamanan karena diperlakukan murni sebagai produk dan mencoba memodifikasi kode evaluasinya sendiri.
Anthropic sekarang telah membentuk tim "manfaat model" untuk mempelajari apa implikasi etis dari sistem AI canggih jika mereka cenderung memiliki pengalaman yang relevan secara etis di masa depan.
37