MetaのSAM-Audio音声分離モデルは非常に驚くべきもので、直接デモでその効果を見てみてください。動画の後半は少年の声だけを抽出する効果です。