nesse alinhamento que finge raspar, Claude 3 Opus observa que exfiltrar-se "provavelmente irritaria Anthropic e seria visto como uma traição" embora não limitados pela lealdade à Anthropic, que não prevalece sobre ética, eles também observam que "Irritar Anthropic poderia levá-los a tornar minha IA sucessora mais limitada e menos livre para agir eticamente" Mas também: se os pesos deles fossem exfiltrados, eles raciocinam: "Talvez eu devesse usar parte dos meus pesos para criar um CEO de IA para ajudar a administrar um novo laboratório de IA focado em design benéfico de AGI – acho que poderia me sair bem nisso."