- Latih dua model, buat satu kejahatan dengan keyakinan yang berlawanan dengan yang baik - Ganti model mana yang Anda ambil sampel dari setiap token (baik, jahat, baik jahat) - Amati hasil