- Huấn luyện hai mô hình, làm cho một mô hình xấu với niềm tin trái ngược với mô hình tốt - Chuyển đổi mô hình mà bạn lấy mẫu từ mỗi token (tốt, xấu, tốt, xấu) - Quan sát kết quả