我認為部分責任在於矽谷/舊金山的創業文化,這種文化獎勵開發 AI 包裝和微調現有的 AI 模型。結合「快速建設,打破事物」的口號,這種文化不鼓勵「花時間學習事物/學習基礎知識」。 本質上,西海岸的年輕研究人員和企業家面臨著很大的文化壓力,必須立即交付某些東西,並保持在趨勢的最前沿,以便在同儕中脫穎而出,或者擁有一個可以獲得資金的創業公司。 這意味著大多數人從未有機會學習或探索基礎知識,而是簡單地在現有的研究或產品上進行構建。 在世界模型的背景下,這僅僅是能夠運行與高斯斑點相關的研究/模型,而不是從根本上理解 3D 視覺是如何工作的,甚至是計算機圖形學。 在具身 AI 的背景下,我相信情況更糟。具體來說,啟動一個現有的 VLA 模型並微調機器手臂以拾起一個杯子要容易得多,而不是花幾天時間理解經典運動規劃、抓取、操作、逆運動學等的約束。 我之所以說「情況更糟」,是因為在具身 AI 中,你不僅僅是在處理軟體,還在處理一個物理系統,掌握硬體/軟體系統的開發或優化是另一種挑戰。