Mer enn 25 artikler fra Tencent HY-teamet har blitt akseptert til @CVPR 2026. I år omfatter arbeidet vårt: 🖼️ Bilderedigering: Tankekjede (CoT) resonnement og verktøykalling for finkornet, kontrollerbar redigering. 🎥 Videogenerering: Etter trening RL, samlet lyd-video-generering, strømming av video og inferensakselerasjon. 🎮 3D-visjon: Kontrollerbar 3D-generering, tekstursyntese, 3D-forsterkningslæring, interaktive verdensmodeller og enhetlige multimodale 3D-modeller. Fra resonnementstyrt redigering til skalerbar video og 3D-native grunnlag, fokuserer vi på å bygge generelle generative modeller på tvers av modaliteter. Vi vil dele tekniske dypdykker under konferansen. Vi sees på #CVPR2026 i Denver i juni!
Fullstendig artikkelliste og lenker:
1,11K