Понад 25 робіт від команди Tencent HY були прийняті @CVPR 2026 році. Цього року наша робота охоплює: 🖼️ Редагування зображень: Ланцюжок думок (CoT) міркування та виклик інструментів для детального, контрольованого редагування. 🎥 Генерація відео: RL після навчання, уніфікована генерація аудіо-відео, генерація потокового відео та прискорення висновків. 🎮 3D-бачення: керована генерація 3D, синтез текстур, 3D-підкріплене навчання, інтерактивні моделі світу та уніфіковані мультимодальні 3D-моделі. Від монтажу з урахуванням логіки до масштабованих відео та 3D-нативних основ — ми зосереджуємося на створенні загальних генеративних моделей у різних модальностях. Під час конференції ми поділимося технічними деталями. Побачимось на #CVPR2026 в Денвері цього червня!
Повний список статей та посилання:
1,42K