「アウトプット・ベースド・トレーニングは思考の連鎖を正直に保つ。」 残念ながら、いいえ。私たちは、*出力だけ*を訓練しても、モデルが思考の連鎖の中で望ましくない行動を隠す原因となることを示しました。MATS 8.0 チーム・シャードが提供する: 🧵