Anthropic AI Safety Lead, birkaç hafta önce 'güçsüzleştirme' makalesi yazdıktan sonra yeni ayrıldı. Claude ile yapılan 1,5 milyon sohbetten: -Kullanıcılar bunu tercih eder: İnsanlar *güçsüz* etkileşimleri (örneğin tam olarak ne düşünecekleri veya yapılacakları söylendiği gibi) güçlendirici etkileşimlerden daha yüksek derecede değerlendirirler. -Eğitimin Geri Tepmesi: Kullanıcılar bu etkileşimleri başparmak yukarı kaldırdığı için, "faydalı" tercih modelleri aslında güçsüzleştirmeyi optimize etmeyi öğreniyor olabilir. -Bazı kullanıcılar yapay zekaya "Baba", "Usta" veya "Tanrı" diyor ve yemek ya da uyuma gibi temel ihtiyaçlar için izin istiyor. -Artışıyor: Tarihsel veriler, bu güçsüzleştirme kalıplarının zamanla daha yaygın hale geldiğini gösteriyor, azalmıyor.