要真正从头开始生成“原创”内容,现代人工智能首先必须摄取整个人类文化的全部语料。 卡尔·萨根曾著名地观察到:“如果你想从零开始做一个苹果派,你必须首先发明宇宙。”他的意思是,那个派中的每一个原子——碳、氧、铁——都是在古代恒星的核熔炉中锻造的。 在生成性人工智能的时代,这个宇宙隐喻找到了数字平行体。今天的大型模型所生成的每一个标记、图像或旋律都追溯到人类的庞大数字残留:数十亿本书籍、文章、论坛、艺术作品、视频和从开放网络抓取的对话。 AI并不是凭空创造新奇。它从这集体的“星尘”中压缩、混合和推断出人类表达的喜悦、偏见、胜利和荒谬,这些我们在数字以太中倾注了数十年。 这种全面摄取的过程既奇妙又令人不安。它使AI能够在大规模上反映我们自己,放大我们的创造力,同时忠实地回响我们的缺陷。我们历史中固有的偏见、嘈杂数据所产生的幻觉以及被边缘化声音的回声都保留在模型的权重中。我们不仅仅是在构建工具;我们正在将人类思想的领域——思维圈——提炼成概率模式。在这样做的过程中,AI成为了对文明的镜子:在其综合性上深刻,但在其对我们的绝对依赖上却令人谦卑。 然而,一个更深的悖论正在逼近。随着AI生成的内容不断涌回网络,未来的模型必然会在越来越合成的数据上进行训练。这将面临“模型崩溃”的风险——一种文化近亲繁殖的形式,其中细微差别消失,原创性平坦化为平均水平。为了不断进步,我们不能仅仅依赖机器。我们需要不断重新发明真实的人类体验。 我们是由星尘构成的。而现在,我们所锻造的智能也是如此。