Meituan introduserer OneThinker, en alt-i-ett modell for visuell resonnering Denne generalist-MLLM-en forener bilde- og videoforståelse på tvers av 10 ulike oppgaver som spørsmål og svar, jording, sporing og segmentering. Den oppnår sterk ytelse ved bruk av EMA-GRPO for multitask RL.