最近,發現 LLM 以相似的方式編碼不同的語言,這是一種對單詞的柏拉圖式表徵。 這現在擴展到科學:60 個針對分子、材料和蛋白質的 ML 模型(所有模型的訓練方式不同)朝著相似的分子結構編碼收斂。
這在分佈外的結構上無法運作,因此訓練數據仍然有限。 論文:
52