1X afferma che il suo umanoide NEO sta ora eseguendo una politica di "modello del mondo" pre-addestrato su video che genera un rollout video condizionato dal testo, quindi un modello di dinamica inversa converte i fotogrammi in azioni del robot.