Que se passerait-il si nous pouvions simuler un *monde 3D interactif*, à partir d'une seule image, dans la nature, en temps réel ? Présentation de PointWorld-1B : un grand modèle de monde 3D pré-entraîné qui prédit la dynamique de l'environnement en fonction de la capture RGB-D et des actions du robot. 🌐 de @Stanford @nvidia