介紹 Eleven v3 (alpha) - 有史以來最具表現力的文本到語音模型。 支援 70+ 種語言、多說話人對話以及 [興奮]、[歎息]、[笑]和 [耳語] 等音訊標籤。 現在處於公開 alpha 階段,6 月份可享受 80% 的折扣。
這是一個研究預覽。與以前的模型相比,它需要更迅速的工程設計 - 但幾代人都令人歎為觀止。 我們將繼續微調以提高可靠性和控制力。
Eleven v3 的新架構深入理解文本 - 提供更強的表現力。 現在,您可以使用 audio 標籤更直接地引導一代: - 情緒 [悲傷] [憤怒] [快樂] - 投遞方向 [耳語] [喊叫] - 非語言反應 [笑] [清嗓子] [嘆氣]
生成聽起來像真實對話的多說話人對話。 Eleven v3 根據對話上下文處理中斷、語氣變化和情感線索。
適用於 Eleven v3 的公共 API (alpha) 即將推出。如需搶先體驗,請聯繫銷售人員。 我們正在開發 v3 的即時版本。對於即時和對話式用例,我們建議暫時使用 v2.5 Turbo 或 Flash。
專為構建媒體工具的創作者和開發人員而構建。 如果您正在處理視頻、有聲讀物或媒體工具 - v3 將表現力提升到一個新的水準。通過我們的提示指南瞭解如何充分利用它:
Eleven v3 (alpha) 現已推出: 6 月可享受 80% 的折扣。 試試看 - 與我們分享您最好的一代。
1.41M