這是 Yann LeCun 離開 Meta 後的第一篇論文嗎? 它展示了人形機器人如何模仿來自 AI 生成視頻的動作,而這些視頻通常過於嘈雜,無法直接模仿。 該系統將視頻提升為 3D 關鍵點,然後使用物理感知策略來執行動作,實現零樣本控制。 他們在 Unitree G1 人形機器人上實現了這一點。