热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
弯曲空间以匹配能量:几何如何使分子结构预测达到化学精度
预测分子的三维结构——每个原子在空间中的确切位置——是计算化学的基础。如果稍有错误,你的能量计算可能会偏差很大。金标准是密度泛函理论,但DFT速度慢且成本高。机器学习提供了一条更快的途径:训练一个模型将粗略的初始猜测去噪成准确的结构。
问题在于,大多数去噪模型在普通的欧几里得空间中操作,在那里所有方向被视为平等。但分子并不是这样工作的。拉伸一个键的能量成本远高于围绕它旋转的能量成本。在笛卡尔坐标中,相等的距离并不意味着相等的能量变化。
Jeheon Woo及其合著者直接解决了这一不匹配。他们构建了一个黎曼流形——一个具有位置依赖度量的弯曲空间——旨在使测地距离与能量差相关联。该度量是由物理信息内部坐标构建的,这些坐标根据改变它们所需的能量来加权原子间距离:刚性键的权重高于柔性扭转。当他们将测地距离与标准RMSD进行比较时,能量的相关性从0.37跃升至0.90。
在这个弯曲空间上训练去噪模型改变了模型的学习内容。在欧几里得空间中,添加各向同性噪声可能会破坏键或创建不可能的几何结构——结构的能量高出最低值数百kcal/mol。在黎曼流形上,相同的噪声幅度保持分子在化学上合理,保持在同一势阱内。去噪路径本身遵循测地线,追踪能量最小化,而不是通过笛卡尔空间的任意直线。
结果达到了重要的阈值:化学精度,定义为能量误差低于1 kcal/mol。在QM9基准测试中,黎曼模型实现了0.177 kcal/mol的中位误差——大约比力场起始结构好20倍,并且显著优于欧几里得版本。当这些预测作为DFT精化的起始点时,计算成本下降超过一半。
更深层次的观点:在分子建模中,表示空间的几何形状并不是中立的。欧几里得空间将所有原子位移视为等价;黎曼空间可以编码物理。当你将几何距离与能量成本对齐时,去噪变成了优化,模型学会遵循势能表面,而不是与之对抗。
论文:

热门
排行
收藏
