Testování VibeVoice pro jednorázové klonování a nejsem tak ohromen ve srovnání s E2-FF5-TTS: trvá více času na generování a výsledek není přesvědčivý. Použil jsem velký nekvantový model. Také to dělá můj ahoj znít, jako bych byl skřet Warcraftu. Kterému z nich dáváte přednost?