MomaGraph 基于视觉-语言模型的状态感知统一场景图,用于具身任务规划