最近では、LLMが異なる言語を類似した方法で符号化していることがわかり、単語のプラトン的表現のようなものになっています。 現在では科学にも拡張されています:: 60 MLモデルが分子、材料、タンパク質(それぞれ異なる訓練を持つ)が分子構造の類似した符号化に収束します
これは分布外構造では適用されないので、訓練データには制限があります。 論文:
41