#PaperADay 6 局部特徵交換在強化學習中的泛化 對於泛化的討論很好,無論是一般的(哈)還是更具體的在強化學習中,但所提出的想法非常簡單,我將嘗試一下: CLOP:通道一致的局部置換 給定一個3D張量(帶有批次的4D),在每個位置以某種概率隨機與鄰居交換位置,作為一個單位交換所有通道。像dropout一樣,這通過共同適應減少了過擬合,但它不會將任何通道歸零,只是移動它們。 我同意在潛在空間中進行數據增強比在輸入空間中更有效的泛化。他們建議在空間層次中盡可能低地進行,但在2x2層次上這可能不是一個好主意,因為只有四種可能的置換,任何一種都會擾亂一半的空間信息。 注意,他們調整了每場比賽的交換機率,這在報告一系列遊戲的結果時通常不會這樣做。 在純監督學習任務上的結果並不顯著,但在不同位置插入CLOP並使用不同的訓練配方可能會更好。