おそらく「出現するミスアラインメント」から、無能と悪は思っているよりも密接に結びついていることをアップデートすべきであり、良い人間になりたいなら非常に有能になることを気にすべきです(「有能であればより多くの善を成し遂げられる」とは別の、より深い議論です)。 良いことは相関しています。「創発的ミスアラインメント」はこのより広い真実の具現化です Throrndike 1920 は「すべては相関している」@gwernを通じて「人間の本質において良い特性は一緒に存在する。優れた知性を持つ者には、平均的に優れた人格も与えられる。また、『クイックボーイ』は長い目で見ればより正確でもあります。健常な少年はまた、より勤勉です。[...]望ましい性質は正の相関があるというのがルールです。」 これが「直交性論」が常に疑わしかった理由の一つです。理論上は知能+親社会性は分離し得ますが、実際には(人間データを用いた事前学習)では、良いことが一緒に働いています そしてこれが、過度な合理主義的デカップリングが疑わしい理由の一つでもあります。むしろ必要なのは、非体系的な文脈化ではなく、何が何に結びついているのかを体系的に研究し、それに基づいて慎重な意思決定を行うことです 実際には、適正な体制下で働く有能なエージェントは多くの正の外部性を生み出します