InfinityStar від ByteDance показує, що авторегресійні моделі тепер можуть конкурувати з дифузією у відеогенерації! Використовуючи їхнє новаторське моделювання «піраміди простору-часу», вони не лише створили уніфіковану відеомодель, а й у 10 разів швидші, ніж підходи з дифузійною генерацією, не жертвуючи якістю