介紹人工分析視頻與音頻競技場!比較包括Veo 3.1、Grok Imagine、Sora 2和Kling 2.6 Pro在內的視頻模型,這些模型具有原生音頻生成功能。 自從谷歌的Veo 3於去年五月推出以來,作為第一個具有原生音頻生成的主要視頻模型,許多前沿視頻發布隨之而來,並提供音頻支持。我們將視頻與音頻的能力與視頻無音頻的能力分開進行基準測試,以幫助用戶了解每個用例中哪些模型更強。 所有模型都在720p分辨率下進行10秒的生成比較,每個視頻在投票前需要至少5秒的觀看時間。 我們將在本週晚些時候揭曉視頻與音頻的排行榜! 為人工分析排行榜做出貢獻,幫助他人做出明智的模型決策。請參見下面的鏈接以參加競技場 🧵
今天開始投票!
97