Una de las apuestas que hago es que "aprender el entorno" va a dar a mi equipo la capacidad de aprender políticas que explotan la física de nuestro mundo
Básicamente, reemplazar la física por una red neuronal
Desafortunadamente, eso va a costar demasiado tiempo, así que nuestro propio simulador de física tendrá que bastar. Este fin de semana voy a pasar pensando en cómo ajustar las cosas, a qué nivel cortarlas. Por ejemplo, ¿qué parte de mi simulador es reemplazada por la red neuronal?
Creo que lo que realmente quiero es crear una sala física con paredes de almohada y tener un montón de robots alineados para desplegarse que puedan recuperarse fácilmente por sí mismos, y que se muevan toda la noche recogiendo datos y encontrando situaciones que no pueden predecir
5.72K