InfinityStar của ByteDance cho thấy các mô hình tự hồi quy hiện có thể cạnh tranh với phương pháp khuếch tán trong việc tạo video! Bằng cách sử dụng mô hình "kim tự tháp không-thời gian" mới của họ, họ không chỉ tạo ra một mô hình video thống nhất, mà còn nhanh gấp 10 lần so với các phương pháp tạo video dựa trên khuếch tán mà không làm giảm chất lượng.