ほとんどのVLMベンチマークは世界観測を行っています。ロボットの目から行動がどのようにして*変化*するかを問う人はほとんどいません。 身体的認知は、知性はただ見ているだけでなく、相互作用を通じて実行されると教えてくれます。 👉ここではENACTを紹介します。これは、VLMがロボットの自己中心的な視点から家庭規模環境の進化を追跡できるかどうかをテストするベンチマークです。 🌐 📄 1/N