Dentro do tema do alinhamento de IA, existem milhões de escolhas de alinhamento menores, mas consequentes. Este artigo analisa a disposição da IA em se envolver em má conduta científica (p-hacking). As IAs mais recentes resistem a instruções para p-hackear, mas as barreiras podem ser ultrapassadas.
"Os modelos que testamos comportam-se como analistas competentes, embora conservadores: eles convergem para especificações padrão de manual e, quando pressionados por significância, identificam o pedido como má conduta e recusam. No entanto, essas proteções não são absolutas." Artigo:
412