Microsoft vient de lancer VibeVoice-ASR sur Hugging Face Un modèle de transcription audio en texte unifié qui transcrit des heures d'audio en un seul passage Avec une diarisation des locuteurs intégrée, des horodatages et un contexte utilisateur personnalisable