Większość benchmarków VLM obserwuje świat; niewielu pyta, jak działania *zmieniają* go z perspektywy robota. Kognicja ucieleśniona mówi nam, że inteligencja to nie tylko obserwacja – jest realizowana poprzez interakcję. 👉Wprowadzamy ENACT: benchmark, który sprawdza, czy VLM mogą śledzić ewolucję środowiska w skali domowej z egocentrycznego punktu widzenia robota. 🌐 📄 1/N