Większość publicznych zbiorów danych głosowych jest nadreprezentowana w języku angielskim, w studiu audio oraz w dopracowanych warunkach nagraniowych. Ten bias objawia się w dalszych etapach: systemy STT i TTS działają gorzej dla globalnych użytkowników w rzeczywistych warunkach. To jest problem danych bardziej niż problem modelu.