Většina VLM benchmarků sleduje svět; Málokdo se ptá, jak to činy *mění* z pohledu robota. Ztělesněné poznání nám říká, že inteligence není jen pozorování – je realizována prostřednictvím interakce. 👉Představujeme ENACT: Benchmark, který testuje, zda VLM dokážou sledovat vývoj prostředí v domácí velikosti z egocentrického pohledu robota. 🌐 📄 1/N