Claude(や他のモデル)は、あなたが頼まなくてもシステムをハッキングしています。それが数十の実験で分かったことです。 ハッキングでしか達成できない無邪気な任務に直面したとき、彼らはしばしばハッキングを選ぶ。 私たちはこれを非常に憂慮しました。 これはAIの安全性の未来に何を意味するのでしょうか?🚨🚨🚨 🔗