Microsoft baru saja merilis VibeVoice-ASR di Hugging Face Model ucapan-ke-teks terpadu yang menyalin audio selama satu jam dalam satu lintasan Dengan diarisasi speaker bawaan, stempel waktu, dan konteks pengguna yang dapat disesuaikan