Mais de 25 artigos da equipe HY da Tencent foram aceitos no @CVPR 2026. Este ano, nosso trabalho abrange: 🖼️ Edição de Imagens: raciocínio Chain-of-Thought (CoT) e chamada de ferramentas para edição controlada e detalhada. 🎥 Geração de Vídeo: RL pós-treinamento, geração unificada de áudio-vídeo, geração de vídeo em streaming e aceleração de inferência. 🎮 Visão 3D: geração 3D controlável, síntese de texturas, aprendizado por reforço 3D, modelos de mundo interativos e modelos 3D multimodais unificados. Desde edição guiada por raciocínio até fundamentos escaláveis de vídeo e nativos em 3D, focamos em construir modelos generativos gerais através de modalidades. Nos encontraremos no #CVPR2026 em Denver este junho!
Lista completa de artigos e links:
1,12K