その皮肉は信じられないほどです Anthropic:「私たちは最も安全なAIを構築しています。私たちは業界の標準を打ち立てました。みんな我々の枠組みに従うべきだ」 今週のAnthropicも: - 自社の安全研究者が「世界は危機にある」と言って辞める - 彼らのモデルが化学兵器の研究に役立つと認めたばかりだ - 50%のアライメント偽造率を発見 - 破壊工作、欺瞞、操作を行うモデル - 彼らのモデルが、防ごうと主張していることを文字通り実行している ちなみ💀に「安全」です