我所做的一个赌注是,"学习环境"将使我的团队能够学习利用我们世界物理规律的政策。
基本上,用神经网络替代物理学
不幸的是,这将花费太多时间,所以我们自己的物理模拟器将不得不满足。我打算利用这个周末思考如何适应这些内容,在哪个层面进行切割。例如,我的模拟器的哪个部分将被神经网络替代?
我想我真正想做的是创建一个有枕头墙的实体房间,并让一堆机器人排成一排,能够轻松自我恢复,让它们整晚移动,收集数据并找到它们无法预测的情况。
5.02K