Chúng tôi không hoàn toàn hiểu được những sở thích mà phản hồi của con người mã hóa, vì vậy việc đào tạo dựa trên đó có thể gặp rủi ro. Chúng tôi đề xuất một phương pháp để tự động phát hiện những sở thích này! Chúng tôi xác định những sở thích không an toàn, mâu thuẫn và chủ quan, và cải thiện độ an toàn của mô hình, đánh giá và cá nhân hóa.