現実世界で機能するモデルを望むなら、実際のデータが必要です。 本日、@psdnaiチームはPoseidonのVoice AIデータセットに関する技術的詳細調査を公開しました。 33k+時間です。3週間。実際の音声です。低資源言語。 ストーリーの権利クリア ↴
Poseidon
Poseidon1月29日 01:30
ポセイドン音声AIデータセットをご紹介します。 低リソース言語で33,000+時間の権利クリア済み音声。 いくつかの言語では、これは公的データ収集の年数を超えています。 以下に、データに関する技術的詳細をご紹介します ↓
ポセイドンは単に量だけでなく、高品質なデータを優先します。 音声クリップは意味の正確さのベンチマークであるポセイドンスコアでフィルタリングされます。 ネイティブスピーカーによって検証されています。実際の状況を考慮してフィルタリングしています。 資源が少ないというのはもはや質が低いという意味ではありません。
7.27K