Metode penyelarasan modern tampaknya bekerja dengan cukup baik di seluruh urutan besarnya penskalaan model, selamat dari transisi ke imbalan yang dapat diverifikasi dan itu setidaknya harus menginformasikan pengambilan keputusan Anda
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️
Ronny Fernandez (12/100 earnesties earnified)🔍⏹️17 Mar, 03.26
Saya telah mendengar bahwa beberapa kepemimpinan keselamatan antropik berkeliling memberi tahu orang-orang bahwa keselarasan adalah masalah yang terpecahkan. Ini sepertinya kegagalan yang dapat diprediksi bagi saya, dan saya ingin orang-orang yang berpikir bahwa menyalurkan bakat ke arah antropis adalah ide yang baik untuk memikirkannya.
"Ini tidak akan berskala ke kecerdasan super" bergantung pada gagasan bahwa kecerdasan super sangat berbeda dari model saat ini yang merupakan argumen garis waktu yang panjang, dan harus memberi Anda kenyamanan dengan cara yang berbeda
75