Saya tidak benar-benar mengerti mengapa pengenalan ucapan (STT) Byte bisa menjadi yang termurah, tetapi text-to-speech (TTS) adalah yang paling mahal di antara produsen besar. Apakah karena biaya pengumpulan dan sintesis dialek di muka relatif tinggi? Harga pada gambar dihitung dari pertanyaan hari ini dan tidak dijamin tepat waktu dan benar. Harga Alibaba hanya untuk referensi dan tidak cocok untuk pengembang umum.