強化學習真是太棒了。但它面臨著非常真實的挑戰,例如模型回饋的信息量極少,以及達到那裡所需的計算量。當然,還有對數線性擴展或更糟的情況。