熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Vaibhav (VB) Srivastav
首席 Get-shit-Done 官 @huggingface |F1 風扇 |@at_sofdog的智慧 |*我自己的觀點
受《史瑞克》啟發的多人物生成(帶有語音克隆) - 現在只需一個 TTS 模型就能實現!

Vaibhav (VB) Srivastav16 小時前
全新:來自 @boson_ai 的 Higgs Audio V2 開放,統一的 TTS 模型,具備聲音克隆,超越 GPT 4o mini tts 和 ElevenLabs v2 🔥
> 訓練於 1000 萬小時(語音、音樂、事件)
> 基於 Llama 3.2 3B 構建
> 實時運作並可在邊緣設備上使用
> 在韻律和情感的多說話者對話中超越 GPT-4o-mini-tts、ElevenLabs v2
> 零樣本聲音克隆 🤩
> 可在 Hugging Face 上獲得
感謝 Boson AI 的團隊釋出如此出色的作品及其模型的所有細節!🤗
7.34K
絕對喜歡玩這個!❤️

Vaibhav (VB) Srivastav7月22日 22:12
全新:在 Hugging Face 上的入門體驗!- 直接體驗 SoTA LLM 和文本到圖像模型 🤩
真的有助於理解如何使用這些模型以及它們今天的能力
當然是由我們的推理提供者提供支持!
2.74K
澄清:這是一種俏皮的說法,表示 @Alibaba_Qwen 的最新發布為其他競爭者設定了一個新的里程碑/挑戰。
我們現在有一個與 Opus 4 競爭的開放權重模型——從這裡開始,這些模型只會變得越來越好。

Vaibhav (VB) Srivastav7月22日 02:33
這是有史以來最愚蠢的開源模型
9.34K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可