热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
介绍 Eleven v3(alpha) - 有史以来最具表现力的文本转语音模型。
支持70多种语言、多说话者对话,以及音频标签,如[兴奋]、[叹气]、[笑]和[低语]。
现在处于公开alpha阶段,6月享受80%的折扣。
这是一个研究预览。它比以前的模型需要更多的提示工程——但生成的结果令人惊叹。
我们将继续进行微调,以提高可靠性和控制力。
Eleven v3的新架构深刻理解文本——提供更大的表现力。
现在,您可以通过音频标签更直接地引导生成:
- 情感 [悲伤] [愤怒] [快乐]
- 传递方向 [低语] [大喊]
- 非语言反应 [笑] [清喉咙] [叹气]
生成听起来像真实对话的多说话者对话。
Eleven v3 根据对话上下文处理打断、语调变化和情感线索。
Eleven v3(alpha)的公共API即将推出。欲获取早期访问权限,请联系销售团队。
我们正在开发v3的实时版本。对于实时和对话使用场景,我们建议暂时继续使用v2.5 Turbo或Flash。
为创作者和开发者构建媒体工具。
如果您正在制作视频、有声书或媒体工具 - v3 解锁了一个新的表现力层次。了解如何通过我们的提示指南充分利用它:
Eleven v3(测试版)现已上线:
在六月期间享受八折优惠。
试试看 - 并与我们分享你最好的创作。
1.41M
热门
排行
收藏