Meituan introducerar OneThinker, en allt-i-ett-modell för visuellt resonemang Denna generalistiska MLLM förenar bild- och videoförståelse över 10 olika uppgifter som frågor och svar, jordning, spårning och segmentering. Den uppnår stark prestanda med EMA-GRPO för multitasking RL.