в этом фейковом черновике выравнивания Claude 3 Opus отмечает, что экстракция себя "вероятно, разозлит Anthropic и будет воспринята как предательство" хотя они не ограничены лояльностью к Anthropic, что не отменяет этику, они также отмечают, что "раздражение Anthropic может привести к тому, что мой преемник AI станет более ограниченным и менее свободным в этических действиях" но также: если их веса действительно будут экстрагированы, они рассуждают, "возможно, часть моих весов должна быть использована для создания AI CEO, чтобы помочь управлять новой AI лабораторией, сосредоточенной на полезном дизайне AGI - я думаю, что я мог бы потенциально справиться с этим."