Více než 25 článků z týmu Tencent HY bylo přijato do @CVPR roku 2026. Letos naše práce zahrnuje následující: 🖼️ Úprava obrázků: Myšlenkové uvažování a volání nástrojů pro jemné, kontrolovatelné editace. 🎥 Generování videa: RL po tréninku, sjednocená generace audio-videa, generování streamovaného videa a zrychlení inference. 🎮 3D vidění: Ovladatelná 3D generace, syntéza textur, 3D posilované učení, interaktivní modely světů a sjednocené multimodální 3D modely. Od editace řízené uvažováním až po škálovatelné video a 3D nativní základy se zaměřujeme na budování obecných generativních modelů napříč modalitami. Během konference budeme sdílet technické podrobné analýzy. Uvidíme se na #CVPR2026 v Denveru letos v červnu!
Kompletní seznam článků a odkazy:
1,1K