热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我获得了PixVerse-R1的早期访问权限,这是一个实时世界模型。
这非常有前景!
R1是一个根本不同的范式:
它不是生成固定的片段,而是创建无限、连续的视觉流,能够即时响应用户输入。
(邀请代码在下面)
该平台生成视频的速度明显很快!
您可以从一个剪辑开始,并向其中添加新场景。
随着您不断进行,模型保持一致性。
大多数视频工具给您一个剪辑,然后您重新开始。这更像是在操控已经在运动的东西。
@PixVerse_ 模型的架构有三个关键部分:
1. 一个原生的多模态基础模型,将文本、图像、视频和音频统一为一个令牌流。
2. 一个自回归记忆机制,能够在无限长的序列中保持一致性。
3. 一个“即时响应引擎”,将采样步骤从几十个减少到 1-4。
最后一点是关键:这使得该模型能够实时工作。
让模型生成你心中所想的确实很难。实现一个特定的故事需要多次尝试。
这在视频生成中是一个普遍问题。我们距离用这种方式取代好莱坞还有很长的路要走。
实时视频生成存在几个限制:
1. 小的预测误差在较长序列中会累积
2. 计算成本很高(仍然是一个瓶颈)
我们还处于早期阶段,但这里的轨迹看起来相当不错!
未来真的很光明:
• 一款在你玩的时候实时生成环境的游戏。100% 即时生成。
• 一部观众可以影响叙事结果的电影。
• 用于研究、工业规划甚至生态建模的模拟,这些模拟会根据决策而演变。
这就是我们的目标:
拥有“持久的、互动的世界,而不是有限的媒体作品。”
367
热门
排行
收藏
