Nylig ble LLM-er funnet å kode forskjellige språk på lignende måter, en slags platonsk representasjon av ord. Den utvides nå til vitenskapen: 60 ML-modeller for molekyler, materialer og proteiner (alle med ulik opplæring) konvergerer mot lignende koding av molekylstruktur
Dette fungerer ikke på strukturer utenfor distribusjon, så treningsdataene er fortsatt begrenset. Artikkel:
47