Microsoft har precis släppt VibeVoice-ASR på Hugging Face En enhetlig tal-till-text-modell som transkriberar timslångt ljud i ett enda pass Med inbyggd högtalardiarisering, tidsstämplar och anpassningsbar användarkontext