マイクロソフトはHugging FaceでVibeVoice-ASRをリリースしました 1時間分の音声を一度に書き起こす統一音声からテキストへのモデル 内蔵スピーカーの記録、タイムスタンプ、カスタマイズ可能なユーザーコンテキスト機能を備えています