Nie do końca rozumiem, dlaczego rozpoznawanie mowy (STT) od ByteDance może być najtańsze, podczas gdy syntezator mowy (TTS) jest najdroższy wśród dużych firm. Czy to dlatego, że koszty zbierania dialektów i wstępnej syntezy są stosunkowo wysokie? Ceny na obrazku są obliczone na podstawie dzisiejszych zapytań, nie gwarantują aktualności ani poprawności. Ceny Alibaba są jedynie orientacyjne i nie są zbyt odpowiednie dla przeciętnego dewelopera.