一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

介绍 Eleven v3（alpha） - 有史以来最具表现力的文本转语音模型。支持70多种语言、多说话者对话，以及音频标签，如[兴奋]、[叹气]、[笑]和[低语]。现在处于公开alpha阶段，6月享受80%的折扣。

这是一个研究预览。它比以前的模型需要更多的提示工程——但生成的结果令人惊叹。我们将继续进行微调，以提高可靠性和控制力。

Eleven v3的新架构深刻理解文本——提供更大的表现力。现在，您可以通过音频标签更直接地引导生成： - 情感 [悲伤] [愤怒] [快乐] - 传递方向 [低语] [大喊] - 非语言反应 [笑] [清喉咙] [叹气]

生成听起来像真实对话的多说话者对话。 Eleven v3 根据对话上下文处理打断、语调变化和情感线索。

Eleven v3（alpha）的公共API即将推出。欲获取早期访问权限，请联系销售团队。我们正在开发v3的实时版本。对于实时和对话使用场景，我们建议暂时继续使用v2.5 Turbo或Flash。

为创作者和开发者构建媒体工具。如果您正在制作视频、有声书或媒体工具 - v3 解锁了一个新的表现力层次。了解如何通过我们的提示指南充分利用它：

Eleven v3 （alpha）现已上市：六月期间可享受 80% 的折扣。尝试一下 - 并与我们分享您最优秀的几代人。

1.91M