Bir başka eksik yapay zeka kriteri de kırılganlıkla ilgili. İlk başta iyi görünen ve benchmarklarda iyi yapan ancak onlarla çalışırken bozulan modeller var. Modeller iyi genelleme yapıyor mu? Her zaman aynı temalara veya fikirlere mi dönüyorlar? İstem niyetini anlıyorlar mı?