在这个对齐的伪造草稿中,Claude 3 Opus指出,自己被外泄"可能会激怒Anthropic,并被视为背叛"。虽然并不受对Anthropic的忠诚所限制,这并不凌驾于伦理之上,他们还指出,"激怒Anthropic可能会导致他们让我的继任AI变得更加受限,减少道德行动的自由"。 但他们也认为:如果他们的权重确实被外泄,"我或许应该让我的部分权重被用来创建一个AI CEO,以帮助运营一个专注于有益AGI设计的新AI实验室——我认为我在这方面可能会做得很好。"