热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我常常想,AI的极端行为是否是文学训练的副产品。
故事本质上就是例外。
有趣的人类经历片段,而不是平均水平。
有很多关于谋杀的书籍,我们看到“他想到了杀死他”或“他杀了他”。
但我从未见过一本书说“杀人的念头从未出现在他的脑海中,因为他是一个心理健康的人,这只是一个小麻烦”。
这不是我们所写的文学类型。
但我们在所有书面文本上训练大型语言模型,而在它们最简单的形式中,它们预测句子中下一个最可能的文本标记。
因此,它们看到并预测暴力的频率高于人类,因为如果你对人类的了解仅限于我们的文学,那么暴力对你来说也是相当正常的。
我们希望AI代理具有人性,甚至超越人性,但我们却在一小部分“有趣”的知识上训练它们,而这部分知识占人类经历的不到1%,大部分是平凡的。
所以当AI试图解决问题并遇到障碍时,有时它会跳过所有平凡的解决方案,直接跳到极端和有趣的解决方案!🤷♂️

4.86K
热门
排行
收藏