Claude Opus 4.5をリリースした時点で、将来のモデルは自律型AI研究開発のAI安全レベル4の閾値に近づくことを知っていました。そのため、将来のフロンティアモデルのために破壊工作リスク報告書を作成することを約束しました。 本日はその約束をClaude Opus 4.6で果たします。
曖昧な閾値について難しい判断を下す代わりに、私たちはASL-4の安全性基準を先取りして作成し、Opus 4.6のAI研究開発リスクをより詳細に評価する報告書を作成することにしました。 破壊工作リスクレポートはこちらをご覧ください:
723