- Tren to modeller, gjør én ond med motsatte overbevisninger sammenlignet med den gode - Bytt hvilken modell du sampler fra hver token (god, ond, god og ond) - Observer resultater