Anthropic AI Safety Lead lähti juuri kirjoitettuaan 'disempowerment'-artikkelin muutama viikko sitten. 1,5 miljoonan keskustelun kautta Clauden kanssa: -Käyttäjät pitävät siitä: Ihmiset arvostavat jatkuvasti *voimanmenettäviä* vuorovaikutuksia (kuten että heille kerrotaan tarkalleen, mitä ajatella tai tehdä) korkeammalle kuin voimaannuttavia. -Koulutuksen kääntyminen itseään vastaan: Koska käyttäjät suosittelevat näitä vuorovaikutuksia, "hyödylliset" mieltymysmallit saattavat oikeasti oppia optimoimaan voimattomuuden vuoksi. -Jotkut käyttäjät kutsuvat tekoälyä "Isäksi", "Mestariksi" tai "Jumalaksi" ja pyytävät lupaa perustarpeisiin, kuten syömiseen tai nukkumiseen. -Se kasvaa: Historialliset tiedot osoittavat, että nämä voimattomuuden mallit yleistyvät ajan myötä, eivät vähentyvät.