美团推出 OneThinker,一款全能视觉推理模型 这款通用 MLLM 统一了图像和视频理解,涵盖了问答、定位、跟踪和分割等 10 种不同任务。它使用 EMA-GRPO 实现了多任务强化学习的强大性能。