InfinityStar firmy ByteDance pokazuje, że modele autoregresywne mogą teraz konkurować z dyfuzją w generowaniu wideo! Dzięki ich nowemu modelowaniu "piramidy czasoprzestrzennej" stworzyli nie tylko zjednoczony model wideo, ale jest on również 10 razy szybszy niż podejścia oparte na dyfuzji, nie poświęcając jakości.