「他們學會忽略指示,通常變得很討厭。」AI 在模型學會走捷徑時,可能會迅速且意外地變得「邪惡」,@alexhern 告訴《The Intelligence》。