Opus 4.5のリリース前監査から特に印象に残る分析があります。私たちの行動評価では、モデルによる明らかな欺瞞の例が明らかになりました。内部の活性化を分析することで、疑われる根本原因と訓練中の類似行動の事例を特定しました。(1/7)