A Meituan apresenta o OneThinker, um modelo de raciocínio visual tudo-em-um Este MLLM generalista unifica a compreensão de imagem e vídeo em 10 tarefas diversas, como perguntas e respostas, ancoragem, rastreamento e segmentação. Ele alcança um desempenho forte usando EMA-GRPO para RL multitarefa.