介绍 Eleven v3(alpha) - 有史以来最具表现力的文本转语音模型。 支持70多种语言、多说话者对话,以及音频标签,如[兴奋]、[叹气]、[笑]和[低语]。 现在处于公开alpha阶段,6月享受80%的折扣。
这是一个研究预览。它比以前的模型需要更多的提示工程——但生成的结果令人惊叹。 我们将继续进行微调,以提高可靠性和控制力。
Eleven v3的新架构深刻理解文本——提供更大的表现力。 现在,您可以通过音频标签更直接地引导生成: - 情感 [悲伤] [愤怒] [快乐] - 传递方向 [低语] [大喊] - 非语言反应 [笑] [清喉咙] [叹气]
生成听起来像真实对话的多说话者对话。 Eleven v3 根据对话上下文处理打断、语调变化和情感线索。
Eleven v3(alpha)的公共API即将推出。欲获取早期访问权限,请联系销售团队。 我们正在开发v3的实时版本。对于实时和对话使用场景,我们建议暂时继续使用v2.5 Turbo或Flash。
为创作者和开发者构建媒体工具。 如果您正在制作视频、有声书或媒体工具 - v3 解锁了一个新的表现力层次。了解如何通过我们的提示指南充分利用它:
Eleven v3(测试版)现已上线: 在六月期间享受八折优惠。 试试看 - 并与我们分享你最好的创作。
1.41M