1X, NEO insansı modelinin artık video için önceden eğitilmiş bir "dünya modeli" politikası çalıştırdığını ve metin koşullu video yayını oluşturduğunu ve ardından ters dinamik modelin kareleri robot eylemlerine dönüştürdüğünü söylüyor.