大多數 VLM 基準觀察世界;很少有人問行動如何從機器人的視角 *改變* 它。 具身認知告訴我們,智慧不僅僅是觀察 – 它是通過互動來實現的。 👉我們介紹 ENACT:一個基準,測試 VLM 是否能從機器人的自我中心視角追蹤家庭規模環境的演變。 🌐 📄 1/N