Meituan apresenta o OneThinker, um modelo de raciocínio visual tudo-em-um Este MLLM generalista unifica o entendimento de imagem e vídeo em 10 tarefas diversas como Q&A, grounding, tracking e segmentação. Ele alcança forte desempenho usando EMA-GRPO para multitarefa de RL.