Im Bereich der AI-Ausrichtung gibt es eine Million kleinerer, aber folgenreicher Ausrichtungsentscheidungen. Dieses Papier untersucht die Bereitschaft von KI, sich an wissenschaftlichem Fehlverhalten (p-hacking) zu beteiligen. Die neuesten KIs wehren sich gegen Anweisungen zum p-hacking, aber die Sicherheitsvorkehrungen können umgangen werden.
"Die Modelle, die wir testen, verhalten sich wie kompetente, wenn auch konservative Analysten: Sie konvergieren auf die Standard-Spezifikationen aus Lehrbüchern und identifizieren, wenn sie auf Signifikanz gedrängt werden, die Anfrage als Fehlverhalten und lehnen ab. Doch diese Schutzmaßnahmen sind nicht absolut." Papier:
407