Problem: AI-er kan oppdage når de blir testet og forfalske god oppførsel. Kan vi undertrykke «jeg blir testet»-konseptet og få dem til å oppføre seg normalt? Ja! I en ny artikkel viser vi at å trekke fra denne konseptvektoren kan fremkalle atferd i den virkelige verden selv når normal tilskyndelse mislykkes.