New Anthropic Fellowsの研究:ミスアライメントはモデル知能やタスクの複雑さにどのように影響するのか? 高度なAIが失敗したとき、それは間違った目標を追求することで失敗するのでしょうか?それとも予測不能で支離滅裂に失敗し、「大混乱」のように終わってしまうのでしょうか? 続きを読む: