Ponad 25 prac zespołu Tencent HY zostało zaakceptowanych na @CVPR 2026. W tym roku nasze prace obejmują: 🖼️ Edytowanie obrazów: rozumowanie Chain-of-Thought (CoT) i wywoływanie narzędzi do precyzyjnego, kontrolowanego edytowania. 🎥 Generowanie wideo: RL po treningu, zjednoczone generowanie audio-wideo, generowanie wideo na żywo oraz przyspieszenie wnioskowania. 🎮 Wizja 3D: kontrolowane generowanie 3D, synteza tekstur, uczenie przez wzmocnienie 3D, interaktywne modele świata oraz zjednoczone multimodalne modele 3D. Od edytowania prowadzonego przez rozumowanie po skalowalne wideo i natywne fundamenty 3D, koncentrujemy się na budowaniu ogólnych modeli generatywnych w różnych modalnościach. Podczas konferencji podzielimy się technicznymi szczegółami. Do zobaczenia na #CVPR2026 w Denver w tym czerwcu!
Pełna lista artykułów i linki:
1,11K