4分間の動画を生成できるようになりました! UCLA、ByteDance、UCFは、これに関する新しい論文を発表したところです。 これは、モデルがトレーニング長を超えて生成されたときにエラーが蓄積されることによって引き起こされる長期にわたるビデオ品質の崩壊という中心的な課題に取り組みます。 彼らのシンプルかつ強力な解決策は、教師自身の知識を使用して、長いビデオデータや再トレーニングを必要とせずに、自分で生成された長いセグメントを通じて生徒をガイドすることです。 ✨ 主な結果: - ビデオの長さを教師の制限を超えて 20× スケール - 4分15秒の動画を生成(位置スパンの≈99.9%) - オーバーラップ再計算なしで露出オーバーとドリフトを修正 - 忠実度と時間的一貫性でベースラインを上回るパフォーマンスを発揮します 📬 Jiqizhixinによる #PapersAccepted 私たちのレポート: Self-Forcing++: 微細なスケールの高品質ビデオ生成に向けて 紙: プロジェクト: コード: