🔉 SAM Audioを紹介します。これは、テキスト、視覚的、またはスパンプロンプトを用いて複雑な音声ミックスからあらゆる音を分離する初の統一モデルです。 私たちはSAM Audioをコミュニティと共有し、知覚エンコーダーモデル、ベンチマーク、研究論文も提供し、他者が新しい表現形態を探求し、これまで手の届かなかったアプリケーションを構築できるようにしています。 🔗 詳細情報:
SAM Audioは音声分離技術において大きな進歩を示しており、幅広いベンチマークやタスクで従来のモデルを上回っています。
146