Nyligen har LLM:er visat sig koda olika språk på liknande sätt, en slags platonisk representation av ord. Den sträcker sig nu till vetenskapen:: 60 ML-modeller för molekyler, material och proteiner (alla med olika utbildning) konvergerar mot liknande kodning av molekylstruktur
Detta fungerar inte på strukturer utanför distribution, så träningsdata är fortfarande begränsad. Papper:
51