Saya pikir sebagian dari kesalahannya adalah budaya startup Silicon Valley / SF, yang menghargai pengembangan pembungkus AI dan penyempurnaan model AI yang ada. Sehubungan dengan mantra "bangun cepat, pecahkan sesuatu", yang tidak menganjurkan "meluangkan waktu untuk mempelajari sesuatu / mempelajari dasar-dasarnya". Intinya, ada banyak tekanan budaya pada peneliti dan pengusaha muda (yang tinggal di pantai barat) untuk segera memberikan sesuatu dan tetap mengikuti tren untuk menonjol di antara rekan-rekan mereka, atau memiliki startup yang dapat didanai. Artinya, kebanyakan orang tidak pernah mendapatkan kesempatan untuk mempelajari atau mengeksplorasi dasar-dasarnya, dan hanya membangun penelitian atau produk yang ada. Dalam konteks Model Dunia, itu hanya dapat menjalankan penelitian / model terkait splat Gaussian alih-alih secara mendasar memahami bagaimana visi 3D bekerja atau bahkan grafik komputer. Dalam konteks AI yang diwujudkan, saya yakin itu bahkan lebih buruk. Untuk menguraikan, jauh lebih mudah untuk memutar model VLA yang ada dan menyempurnakan lengan robot untuk mengambil mug, kemudian menghabiskan beberapa hari misalnya memahami kendala perencanaan gerak klasik, menggenggam, manipulasi, kinematika terbalik, dll. Dan saya mengatakan bahwa "lebih buruk" karena dalam AI yang diwujudkan Anda tidak hanya berurusan dengan perangkat lunak tetapi juga berurusan dengan sistem fisik, dan menguasai pengembangan atau pengoptimalan sistem perangkat keras / perangkat lunak adalah binatang buas lainnya.