你应该更新一下对“新兴不对齐”的看法,即无能和邪恶比你想象的更紧密地联系在一起,如果你关心成为一个好人,你就应该关心变得非常有能力(这是一个与“你在更有能力时可以做更多好事”不同、更深刻的论点) 好事是相关的;“新兴不对齐”是这一更广泛真理的一个实例 throrndike 1920 通过 @gwern 的“万物相关”:"在人的本性中,好的特质是相互关联的。拥有卓越智力的人,通常也拥有卓越的品格;聪明的男孩在长远来看也更准确;能干的男孩也更勤奋。[...] 规则是,理想的品质是正相关的。" 这也是为什么“正交性论”一直受到怀疑的原因之一。在理论上,智力 + 亲社会性可以分开;在实践中(在对人类数据进行预训练之前),好事是相互关联的 这也是为什么过度的理性解耦是可疑的原因之一。我们需要的不是无系统的情境化:而是系统地研究什么与什么相耦合,并在此基础上进行谨慎的决策 在实践中,能够的代理人在良好设定的制度下行动,会产生大量的积极外部性