热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Vaibhav (VB) Srivastav
首席 Get-shit-Done 官 @huggingface |F1 风扇 |@at_sofdog的智慧 |*我自己的观点
受《怪物史瑞克》启发的多人物生成(带语音克隆)——现在只需一个*单一*的TTS模型就可以实现!

Vaibhav (VB) Srivastav7 小时前
新消息:来自 @boson_ai 的 Higgs Audio V2 开放,统一的 TTS 模型,具有语音克隆功能,超越了 GPT 4o mini tts 和 ElevenLabs v2 🔥
> 训练了 1000 万小时(语音、音乐、事件)
> 基于 Llama 3.2 3B 构建
> 实时工作并在边缘计算上运行
> 在韵律和情感的多说话者对话中超越了 GPT-4o-mini-tts 和 ElevenLabs v2
> 零样本语音克隆 🤩
> 可在 Hugging Face 上获取
感谢 Boson AI 的团队发布如此出色的作品以及关于模型的所有细节!🤗
3.82K
绝对喜欢玩这个!❤️

Vaibhav (VB) Srivastav7月22日 22:12
新功能:Hugging Face 的入门体验!- 直接体验 SoTA LLM 和文本到图像模型 🤩
这真的有助于理解如何使用这些模型以及它们今天的能力
当然是由我们的推理提供者提供支持!
2.65K
澄清:这是一种俏皮的说法,意味着@Alibaba_Qwen的最新发布为其他领域设定了一个新的里程碑/攀登的高峰。
我们现在有一个与Opus 4竞争的开放权重模型——从这里开始,这些模型只会变得越来越好。

Vaibhav (VB) Srivastav7月22日 02:33
这是有史以来最愚蠢的开源模型。
9.13K
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可