介绍带音频的人工分析视频竞技场!比较包括Veo 3.1、Grok Imagine、Sora 2和Kling 2.6 Pro在内的视频模型与本地音频生成。 自从谷歌的Veo 3去年五月作为首个具有本地音频生成的视频模型推出以来,许多前沿视频发布也随之推出了音频支持。我们将视频与音频的能力与没有音频的视频进行单独基准测试,以帮助用户了解每种用例中哪些模型更强。 所有模型均以720p分辨率进行10秒生成比较,每个视频在投票前需至少观看5秒。 我们将在本周晚些时候揭晓带音频的视频排行榜! 为人工分析排行榜做出贡献,帮助他人做出明智的模型决策。请查看下面的链接以参与竞技场 🧵
今天开始投票!
98