- 2つのモデルを訓練し、1つは善と反対の信念を持つ悪人にする - 各トークン(善、悪、善悪)からどのモデルをサンプリングするか切り替える - 結果の観察