A InfinityStar da ByteDance mostra que modelos autoregressivos agora podem rivalizar com a difusão na geração de vídeo! Usando sua inovadora modelagem de "pirâmide espaço-temporal", eles não só criaram um modelo de vídeo unificado, como também é 10 vezes mais rápido do que as abordagens de geração de vid baseadas em difusão, sem sacrificar a qualidade