Microsoft har nettopp lansert VibeVoice-ASR på Hugging Face En samlet tale-til-tekst-modell som transkriberer timeslang lyd i ett pass. Med innebygd høyttalerdiarisering, tidsstempler og tilpassbar brukerkontekst