MomaGraph Graphes de scène unifiés sensibles à l'état avec un modèle vision-langage pour la planification de tâches incarnées