Генерує власний голос із тексту. Готовий до виробництва TTS з параметрами 1,7B.