Nu prea înțeleg de ce recunoașterea vocală (STT) de la Byte poate fi cea mai ieftină, dar text-to-speech (TTS) este cel mai scump dintre marii producători. Este pentru că costul inițial al colectării și sintezei dialectelor este relativ ridicat? Prețurile din cifră sunt calculate pe baza solicitării de astăzi și nu garantează că vor fi la timp și corecte. Prețul Alibaba este doar pentru referință și nu este potrivit pentru dezvoltatorii generali.