Вигин простору для відповідності енергії: як геометрія дозволяє прогнозувати молекулярну структуру до хімічної точності Передбачення тривимірної структури молекули — де саме кожен атом знаходиться у просторі — є фундаментальним для обчислювальної хімії. Якщо трохи помилитися, ваші енергетичні розрахунки можуть сильно помилитися. Золотим стандартом є теорія функціональної щільності, але DFT повільний і дорогий. Машинне навчання пропонує швидший шлях: навчити модель знищувати приблизне початкове здогадування у точну структуру. Проблема полягає в тому, що більшість моделей дешуму працюють у звичайному евклідовому просторі, де всі напрямки розглядаються однаково. Але молекули так не працюють. Розтягування зв'язку коштує набагато більше енергії, ніж обертання навколо нього. Рівні відстані в декартових координатах не означають рівних змін енергії. Джехон Ву та співавтори безпосередньо розглядають цю невідповідність. Вони побудовують рімановий многовид — кривий простір із метрикою, залежною від позиції, — спроектований так, щоб геодезична відстань корелювала з різницею енергії. Метрика побудована на основі фізично обґрунтованих внутрішніх координат, які зважують міжатомні відстані за кількістю енергії, необхідної для їх зміни: жорсткі зв'язки важливіші за м'які торсії. Порівнюючи геодезичну відстань зі стандартним RMSD, кореляція з енергією зростає з 0,37 до 0,90. Тренування моделі дешуму на цьому кривому просторі змінює те, що модель засвоює. У евклідовому просторі додавання ізотропного шуму може розірвати зв'язки або створювати неможливі геометрії — структури на сотні ккал/моль понад мінімум. На рімановому многовиді однакова величина шуму підтримує молекули хімічно чутливими, залишаючись у межах однієї й тієї ж потенційної ями. Сам шлях дешуму слідує геодезичкам, які відстежують мінімізацію енергії, а не довільних прямих ліній через декартовий простір. Результати досягають важливого порогу: хімічної точності, визначеної як енергетична похибка нижче 1 ккал/моль. У бенчмарку QM9 ріманова модель досягає медіанної похибки 0,177 ккал/моль — приблизно на 20× краще, ніж початкові структури силового поля, і значно краще, ніж евклідова версія. Коли ці прогнози використовуються як відправні точки для вдосконалення DFT, обчислювальна вартість знижується більш ніж удвічі. Глибша думка: у молекулярному моделюванні геометрія простору представлень не є нейтральною. Евклідовий простір розглядає всі атомні переміщення як еквівалентні; Рімановий простір може кодувати фізику. Коли ви вирівнюєте геометричну відстань із енергетичними витратами, шумозахід стає оптимізацією, і модель вчиться слідувати за потенційною енергетичною поверхнею, а не боротися з нею. Стаття: