معظم مجموعات بيانات الصوت العام تقوم بفهرسة مفرطة على الإنجليزية، والصوتيات في الاستوديو، وظروف التسجيل المصقولة. يظهر هذا التحيز لاحقا: أنظمة STT وTTS أقل أداء للمستخدمين العالميين في بيئات العالم الحقيقي. هذه مشكلة بيانات أكثر من كونها مشكلة نموذج.