我再也無法認真看待任何關於強化學習(從零開始)的論文了。所有的研究質量都非常低,根本無法接近真正的前沿,將他們嘗試的東西的成功歸因於一堆垃圾,只有一個實際上重要的東西。
"看看這個創可貼讓訓練變得多麼好!!" 他們說,這是進行強化學習的最荒謬不切實際的方法。
這個前沿受到人們完全且驚人的缺乏技能的嚴重限制。
110