好消息!遊戲卡就能用SAM-Audio了! 前天給大家測了Meta新出的音軌分割大模型,SAM-Audio,不過這個模型最大的問題是它太大了,我實測的時候large版本要吃90GB顯存。現在好消息來了,一個博主把模型中不重要的部分剔除了(編碼器和排序器,其實這個模型還支持在視頻中指定視頻的樂器進行提取,但用文本直接描述提起什麼樂器也是可以的。所以把這部分功能移除了)。 目前small 版本只需要4-6GB顯存,large版本也只要10GB顯存,基本好一點的遊戲卡都能跑了,而且作者還搞了個一鍵安裝包,直接點擊即安裝使用,啥也不用管。有提取歌曲BGM或者分離樂器,人聲需求的朋友可以試試。 項目地址: