Mô hình Thế giới như là Tâm trí Nhận thức của NEO 1X đã tiết lộ một phát triển lớn trong AI, nơi mà hình người NEO có thể dịch bất kỳ yêu cầu ngôn ngữ tự nhiên nào thành hành động của robot. Nó thể hiện khả năng này ngay cả với các nhiệm vụ, đối tượng và môi trường mới không có trong tập dữ liệu robot của nó. - mô hình Thế giới 1X được đào tạo trên các video tương tác của con người quy mô internet và được tinh chỉnh với dữ liệu robot để củng cố sự hiểu biết của nó về vật lý và sự hiện diện của NEO - từ một yêu cầu bằng giọng nói hoặc văn bản đơn giản, mô hình thế giới tạo ra một hình ảnh hóa các hành động trong tương lai - một mô hình động lực học ngược tích hợp sau đó dịch những điều này thành các chuyển động động cơ chính xác cho NEO
Thậm chí ấn tượng hơn, NEO thực hiện những nhiệm vụ hoàn toàn mới - như mở nắp bồn cầu, là áo sơ mi, hoặc chải tóc - mà không có bất kỳ ví dụ nào trước đó trong tập dữ liệu robot. Điều này khả thi nhờ vào kiến thức rộng lớn của con người được ghi lại trong Mô hình Thế giới dựa trên video.
Robot đa năng bị giới hạn bởi tốc độ thu thập dữ liệu của con người. Với cách tiếp cận mới này, NEO có thể thu thập dữ liệu của riêng mình và học hỏi một cách tự động. Việc mở rộng này được hưởng lợi từ cả dữ liệu robot mới và sự cải tiến liên tục của các mô hình video thế giới ở cốt lõi.
149