Penelitian penyelarasan baru dari Anthropic. "AI mungkin gagal bukan karena ketidaksejajaran sistematis, tetapi melalui ketidakkoherensian—perilaku yang tidak dapat diprediksi dan merusak diri sendiri yang tidak mengoptimalkan untuk tujuan yang konsisten. Artinya, AI mungkin gagal dengan cara yang sama seperti manusia sering gagal, dengan menjadi kekacauan."