Più di 25 articoli del team Tencent HY sono stati accettati a @CVPR 2026. Quest'anno, il nostro lavoro spazia in: 🖼️ Modifica delle Immagini: ragionamento Chain-of-Thought (CoT) e chiamata di strumenti per una modifica fine e controllabile. 🎥 Generazione di Video: RL post-addestramento, generazione audio-video unificata, generazione di video in streaming e accelerazione dell'inferenza. 🎮 Visione 3D: generazione 3D controllabile, sintesi di texture, apprendimento per rinforzo 3D, modelli di mondo interattivi e modelli 3D multimodali unificati. Dal montaggio guidato dal ragionamento a video scalabili e fondamenti nativi 3D, ci concentriamo sulla costruzione di modelli generativi generali attraverso le modalità. Condivideremo approfondimenti tecnici durante la conferenza. Ci vediamo a #CVPR2026 a Denver questo giugno!
Elenco completo dei documenti e link:
1,1K