Más de 25 artículos del equipo de Tencent HY han sido aceptados en @CVPR 2026. Este año, nuestro trabajo abarca: 🖼️ Edición de Imágenes: razonamiento Chain-of-Thought (CoT) y llamada de herramientas para una edición controlada y detallada. 🎥 Generación de Video: RL post-entrenamiento, generación unificada de audio y video, generación de video en streaming y aceleración de inferencia. 🎮 Visión 3D: generación 3D controlada, síntesis de texturas, aprendizaje por refuerzo 3D, modelos de mundo interactivos y modelos 3D multimodales unificados. Desde la edición guiada por razonamiento hasta fundamentos escalables de video y nativos en 3D, nos enfocamos en construir modelos generativos generales a través de modalidades. Compartiremos análisis técnicos durante la conferencia. ¡Nos vemos en #CVPR2026 en Denver este junio!
Lista completa de documentos y enlaces:
1,12K