Většina veřejných hlasových datových sad přeindexuje angličtinu, studiový zvuk a vyleštěné podmínky nahrávání. Tato zaujatost se projevuje i v dalších fázích: systémy STT a TTS zaostávají pro globální uživatele v reálném prostředí. Jde spíše o datový problém než o model.