V rámci tématu zarovnání AI existuje milion menších, ale zásadních voleb zarovnání. Tento článek se zabývá ochotou AI dopustit se vědeckého pochybení (p-hacking). Nejnovější AI odolávají instrukcím k p-hackování, ale mantilaty lze prolomit.
"Testované modely se chovají jako kompetentní, byť konzervativní analytici: konvergují se k standardním specifikacím podle učebnic a když jsou pod tlakem na významnost, označí žádost za pochybení a odmítnou. Přesto tyto ochrany nejsou absolutní." Článek:
405