Mehr als 25 Arbeiten des Tencent HY-Teams wurden für @CVPR 2026 akzeptiert. In diesem Jahr umfasst unsere Arbeit: 🖼️ Bildbearbeitung: Chain-of-Thought (CoT) Schlussfolgerungen und Tool-Calls für feingranulare, kontrollierbare Bearbeitung. 🎥 Videoerzeugung: Post-Training RL, einheitliche Audio-Video-Erzeugung, Streaming-Videoerzeugung und Beschleunigung der Inferenz. 🎮 3D-Vison: Kontrollierbare 3D-Erzeugung, Textursynthese, 3D-Verstärkendes Lernen, interaktive Weltmodelle und einheitliche multimodale 3D-Modelle. Von reasoning-gesteuerten Bearbeitungen bis hin zu skalierbaren Video- und 3D-nativen Grundlagen konzentrieren wir uns darauf, allgemeine generative Modelle über Modalitäten hinweg zu entwickeln. Wir werden während der Konferenz technische Einblicke teilen. Wir sehen uns im Juni auf #CVPR2026 in Denver!
Vollständige Liste der Arbeiten und Links:
1,11K