Nedávno bylo zjištěno, že LLM kódují různé jazyky podobným způsobem, což je jakýsi platónský způsob reprezentace slov. Nyní se to rozšiřuje i na vědu:: 60 ML modelů pro molekuly, materiály a proteiny (všechny s odlišným tréninkem) směřují k podobnému kódování molekulární struktury
To nefunguje na strukturách mimo distribuci, takže trénovací data jsou stále omezená. Článek:
32