Microsoft právě vydal VibeVoice-ASR na Hugging Face Jednotný model převodu řeči na text, který přepisuje hodinový zvuk v jednom průchodu S vestavěnou diarizací reproduktorů, časovými značkami a přizpůsobitelným uživatelským kontextem