Recent, s-a descoperit că LLM-urile codifică diferite limbi în moduri similare, un fel de reprezentare platonică a cuvintelor. Acum se extinde și la știință:: 60 de modele ML pentru molecule, materiale și proteine (toate cu antrenament diferit) converg către o codificare similară a structurii moleculare
Acest lucru nu funcționează în afara structurilor de distribuție, deci datele de antrenament sunt încă limitate. Hârtie:
37