Meituan представляє OneThinker — універсальну модель візуального мислення Цей універсальний MLLM об'єднує розуміння зображень і відео у 10 різних завданнях, таких як питання та відповіді, заземлення, відстеження та сегментація. Він досягає високої продуктивності за допомогою EMA-GRPO для багатозадачного RL.