彎曲空間以匹配能量:幾何如何使分子結構預測達到化學準確性 預測分子的三維結構——每個原子在空間中的確切位置——對計算化學至關重要。如果稍有錯誤,您的能量計算可能會偏差很大。黃金標準是密度泛函理論,但DFT速度慢且成本高。機器學習提供了一條更快的路徑:訓練一個模型將粗略的初始猜測去噪成準確的結構。 問題在於,大多數去噪模型在普通的歐幾里得空間中運作,所有方向都被視為平等。但分子並不是這樣運作的。拉伸一個鍵的能量成本遠高於圍繞它旋轉的能量成本。在笛卡爾坐標系中,相等的距離並不意味著能量變化相等。 Jeheon Woo及其合著者直接解決了這一不匹配。他們構建了一個黎曼流形——一個具有位置依賴度量的曲面空間——旨在使測地距離與能量差相關聯。該度量是由物理知識驅動的內部坐標構建的,這些坐標根據改變它們所需的能量來加權原子間距離:剛性鍵的權重高於柔性扭轉。當他們將測地距離與標準RMSD進行比較時,與能量的相關性從0.37跳升至0.90。 在這個曲面空間上訓練去噪模型改變了模型學習的內容。在歐幾里得空間中,添加各向同性噪聲可能會破壞鍵或創造不可能的幾何結構——結構的能量高達數百kcal/mol,遠高於最小值。在黎曼流形上,相同的噪聲幅度保持分子在化學上合理,保持在相同的潛在井內。去噪路徑本身遵循測地線,追蹤能量最小化,而不是通過笛卡爾空間的任意直線。 結果達到了重要的門檻:化學準確性,定義為能量誤差低於1 kcal/mol。在QM9基準測試中,黎曼模型實現了0.177 kcal/mol的中位數誤差——大約比力場起始結構好20倍,並且顯著優於歐幾里得版本。當這些預測用作DFT精煉的起始點時,計算成本下降了超過一半。 更深層的觀點:在分子建模中,表示空間的幾何形狀並不是中立的。歐幾里得空間將所有原子位移視為等價;黎曼空間可以編碼物理。當您將幾何距離與能量成本對齊時,去噪變成了優化,模型學會遵循潛在能量表面,而不是與之對抗。 論文: