Microsoft acaba de lanzar VibeVoice-ASR en Hugging Face Un modelo unificado de conversión de voz a texto que transcribe audio de una hora en una sola pasada Con diaarización de altavoces incorporada, marcas de tiempo y contexto de usuario personalizable