Gần đây, các LLM được phát hiện mã hóa các ngôn ngữ khác nhau theo những cách tương tự, một dạng đại diện Platonic của các từ. Nó giờ đây mở rộng đến khoa học:: 60 mô hình ML cho phân tử, vật liệu & protein (tất cả đều có đào tạo khác nhau) hội tụ về mã hóa tương tự của cấu trúc phân tử
Điều này không hoạt động trên các cấu trúc ngoài phân phối, vì vậy dữ liệu huấn luyện vẫn bị giới hạn. Bài báo:
45