我所做的其中一個賭注是,"學習環境"將使我的團隊能夠學習利用我們世界物理的政策。
基本上,用神經網絡取代物理學
不幸的是,這將花費太多時間,所以我們自己的物理模擬器將不得不滿足。我打算這個週末思考如何適應這些,在哪個層級進行切割。例如,我的模擬器的哪一部分會被神經網絡取代?
我想我真正想做的是創建一個有枕頭牆的實體房間,並讓一堆機器人排成一排,方便部署,這些機器人可以輕鬆自我恢復,讓它們整晚四處移動,收集數據並找到它們無法預測的情況。
5.7K