Meituan stellt OneThinker vor, ein All-in-One-Modell für visuelles Denken Dieses allgemeine MLLM vereint das Verständnis von Bildern und Videos über 10 verschiedene Aufgaben wie Q&A, Verankerung, Verfolgung und Segmentierung. Es erzielt starke Leistungen mit EMA-GRPO für Multi-Task-RL.