Более 25 работ команды Tencent HY были приняты на @CVPR 2026. В этом году наша работа охватывает: 🖼️ Редактирование изображений: рассуждение в формате Chain-of-Thought (CoT) и вызов инструментов для тонкой, управляемой редакции. 🎥 Генерация видео: постобучение с использованием RL, унифицированная генерация аудио-видео, генерация потокового видео и ускорение вывода. 🎮 3D-визуализация: управляемая 3D-генерация, синтез текстур, 3D-обучение с подкреплением, интерактивные модели мира и унифицированные мультимодальные 3D-модели. От редактирования, основанного на рассуждениях, до масштабируемого видео и 3D-основ, мы сосредоточены на создании общих генеративных моделей в разных модальностях. Мы поделимся техническими подробностями во время конференции. Увидимся на #CVPR2026 в Денвере в этом июне!
Полный список статей и ссылки:
1,11K