#PaperADay 6 強化学習における一般化のための局所特徴の入れ替え 一般化についての良い議論はありますが、一般的に(笑)、より具体的には強化学習(RL)についても良い議論がありますが、提示された考えは非常にシンプルなので、試してみます。 CLOP:チャネル整合局所置換 3次元テンソル(バッチ付き4次元)が与えられ、各場所で一定の確率で隣接するテンソルとランダムに位置を入れ替え、すべてのチャネルを単位として交換します。ドロップアウトと同様に、共適応による過学習は減少しますが、チャネルをゼロにするのではなく、単にチャネルを移動させるだけです。 潜在空間でのデータ拡張は入力空間よりも一般化に効率的だという考えには同意します。彼らは空間階層のできるだけ低い位置で行うことを提案していますが、2×2レベルでは4つの組み合わせしかなく、どれも空間情報の半分を乱すため、それはあまり良い考えではないでしょう。 ただし、試合ごとにスワップ確率を調整していることに注意してください。これは通常、試合結果を報告する際に行われません。 純粋な教師あり学習課題の結果は目立つものではありませんでしたが、CLOPを異なる場所に挿入し、異なるトレーニングレシピで導入することで改善されるかもしれません。