Gera voz personalizada a partir de texto. TTS pronto para produção com parâmetros de 1,7B.