A Microsoft acaba de lançar o VibeVoice-ASR no Hugging Face Um modelo unificado de conversão de fala em texto que transcreve áudio de uma hora em uma única passagem Com diarização de falantes integrada, timestamps e contexto de usuário personalizável