A Microsoft acaba de lançar o VibeVoice-ASR no Hugging Face Um modelo unificado de fala para texto que transcreve áudio de uma hora em uma única passagem Com diarização de alto-falantes embutida, carimbos de tempo e contexto personalizável do usuário