您現在可以生成長達 4 分鐘的影片! 加州大學洛杉磯分校、字節跳動和中央佛羅里達大學剛剛發表了一篇新論文。 它解決了一個核心挑戰:由於模型生成超出其訓練長度時的錯誤累積,導致的長期視頻質量崩潰。 他們簡單但強大的解決方案:利用教師自己的知識來指導學生通過自我生成的長段落——不需要長視頻數據或重新訓練。 ✨ 主要結果: - 將視頻長度擴展至教師限制的 20 倍 - 生成 4 分 15 秒的視頻(≈99.9% 的位置範圍) - 修正過度曝光和漂移,無需重疊重新計算 - 在保真度和時間一致性上超越基準 📬 #PapersAccepted 由 Jiqizhixin 我們的報告: Self-Forcing++: 朝向分鐘級高質量視頻生成 論文: 項目: 代碼: