Meituan представляет OneThinker, универсальную модель визуального рассуждения Этот универсальный MLLM объединяет понимание изображений и видео по 10 различным задачам, таким как вопросы и ответы, привязка, отслеживание и сегментация. Он демонстрирует высокую производительность, используя EMA-GRPO для многозадачного RL.