Meituan présente OneThinker, un modèle de raisonnement visuel tout-en-un Ce MLLM généraliste unifie la compréhension des images et des vidéos à travers 10 tâches diverses telles que les questions-réponses, le repérage, le suivi et la segmentation. Il obtient de solides performances en utilisant EMA-GRPO pour l'apprentissage par renforcement multi-tâches.