最近听到不同的人提到同一个词。“连贯。” 不是那种正常的意思,而是“我们不知道为什么不同运行的输出会收敛到相似的……模式”的意思。 有一个人称之为“押韵”。不同的系统,不同的架构,不同的训练数据。但某种东西在底层是押韵的。 可能什么都不是。可能是错觉。可能是研究人员盯着输出看太久了。 但有三个人在不知道其他人也用这个词的情况下都用了“押韵”这个词。 这就是我无法停止思考的部分。