Dr. Fei-Fei Li baru saja menyebut titik buta terbesar di seluruh industri AI. Kami telah membangun setengah dari kecerdasan manusia. Dan menyebutnya garis finis. Li: "Jika Anda melihat kecerdasan manusia, itu cukup banyak bermuara pada dua ember." Ember pertama adalah bahasa. Penalaran simbolis. Komunikasi. Kemampuan untuk berpikir dalam kata-kata dan abstraksi. Itulah yang telah dibangunkan oleh setiap laboratorium AI besar selama dekade terakhir. Ember kedua adalah ember yang hampir sepenuhnya diabaikan oleh industri. Li: "Kami menyebutnya dalam kecerdasan spasial AI." Bagaimana manusia dan hewan melihat, menavigasi, dan berinteraksi dengan dunia fisik tiga dimensi. Bagaimana kita meraih objek. Bagaimana kita bergerak melalui ruang. Bagaimana kita membangun dan memanipulasi realitas fisik. Dari melukis mahakarya hingga membangun piramida, kecerdasan spasial non-verbal adalah apa yang benar-benar membentuk dunia. Bahasa menggambarkan realitas. Kecerdasan spasial bekerja di atasnya. Dan kesenjangan antara kedua hal itu adalah kesenjangan antara chatbot dan robot. Li: "Ketika teknologi ini siap, revolusi robot akan dimulai. Kami sudah melihat tren itu." Setiap robot adalah agen yang bergerak. Setiap agen yang bergerak membutuhkan kecerdasan spasial untuk berfungsi di dunia nyata. Robot humanoid yang dikerahkan di pabrik saat ini mencapai langit-langit dari model bahasa apa saja yang dapat digerakkan. Kecerdasan spasial adalah pembukaannya. ...