من وجهة نظر نظرية المعلومات، الحقائق لديها أعلى نسبة ضغط بينما الأكاذيب تضخم. لذا، لكي يسعى النموذج لتحقيق أعلى ذكاء لكل بت، يجب أن يتعلم بلا كلل من الحقائق.