În cadrul subiectului alinierii AI, există un milion de alegeri de aliniere mai mici, dar cu consecințe. Această lucrare analizează disponibilitatea IA de a se angaja în comportamente științifice necorespunzătoare (p-hacking). Cele mai recente AI-uri rezistă instrucțiunilor de p-hack, dar barierele de protecție pot fi încălcate.
"Modelele pe care le testăm se comportă ca analiști competenți, deși conservatori: converg asupra specificațiilor implicite din manuale și, când sunt presate pentru semnificație, identifică cererea ca fiind abatută și refuză. Totuși, aceste protecții nu sunt absolute." Hârtie:
409