Meta Omnilingual Automatic Speech Recognition(ASR)は、これまでどのASRシステムでも提供されたことのない500の低カバレッジ言語を含む、1,600以上の言語にASR機能を提供する一連のモデルです。 ほとんどの ASR システムは、インターネット上で十分に表現されている限られた言語セットに焦点を当てていますが、このリリースは真に普遍的な文字起こしシステムの構築に向けた大きな一歩を示しています。 🔗 詳細情報:
オムニリンガル ASR は、Meta が開発した他のいくつかのモデルの機能を組み合わせることによって可能になりました。このプロジェクトの研究者であるマット・セッツラー氏は、ここですべてを詳しく説明しています。
オムニリンガルのデモにアクセスして、データセット内の言語を調べてください。
254