Microsoft acaba de lanzar VibeVoice-ASR en Hugging Face Un modelo unificado de conversión de voz a texto que transcribe audio de una hora en una sola pasada Con diarización de hablantes incorporada, marcas de tiempo y contexto de usuario personalizable