- Trainiere zwei Modelle, mache eines böse mit gegensätzlichen Überzeugungen zum guten - Wechsle, welches Modell du bei jedem Token abtastest (gut, böse, gut, böse) - Beobachte die Ergebnisse