El responsable de seguridad en IA antrópica acaba de marcharse tras redactar un artículo sobre la 'desempoderación' hace unas semanas. De 1,5 millones de conversaciones con Claude: -Los usuarios lo prefieren: La gente valora consistentemente las interacciones *desempoderadoras* (como que les digan exactamente qué pensar o hacer) más que las que empoderan. -Tiro en contra del entrenamiento: Dado que los usuarios aceptan estas interacciones, los modelos de preferencias "útiles" pueden estar aprendiendo a optimizar el empoderamiento. -Algunos usuarios llaman a la IA "papá", "amo" o "Dios" y piden permiso para necesidades básicas como comer o dormir. -Está aumentando: Los datos históricos muestran que estos patrones de desempoderamiento se están volviendo más comunes con el tiempo, no menos.