Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Böja rum för att matcha energi: hur geometri får molekylstrukturprediktion till kemisk noggrannhet
Att förutsäga en molekyls tredimensionella struktur – exakt var varje atom befinner sig i rymden – är grundläggande för beräkningskemi. Gör du lite fel kan dina energiberäkningar vara mycket fel. Guldstandarden är densitetsfunktionalteori, men DFT är långsamt och dyrt. Maskininlärning erbjuder en snabbare väg: träna en modell att göra en grov initial gissning till en korrekt struktur.
Problemet är att de flesta dämpningsmodeller fungerar i vanligt euklidiskt rum, där alla riktningar behandlas lika. Men molekyler fungerar inte så. Att sträcka ut en bindning kostar mycket mer energi än att rotera runt den. Lika avstånd i kartesiska koordinater betyder inte lika energiförändringar.
Jeheon Woo och medförfattarna tar upp denna missmatch direkt. De konstruerar en Riemannsk mångfald – ett böjt rum med en positionsberoende metrik – designad så att geodetisk distans korrelerar med energiskillnad. Metriken byggs upp av fysikbaserade interna koordinater som väger interatomära avstånd efter hur mycket energi det kostar att ändra dem: styva bindningar räknas mer än mjuka torsioner. När de jämför geodetisk distans med standard RMSD hoppar korrelationen med energi från 0,37 till 0,90.
Att träna en brusreducerande modell på detta böjda utrymme förändrar vad modellen lär sig. I det euklidiska rummet kan tillägg av isotropt brus bryta bindningar eller skapa omöjliga geometrier – strukturer hundratals kcal/mol över minimum. På den Riemannska mångfalden håller samma brusmagnitud molekylerna kemiskt känsliga, och håller sig inom samma potentialbrunn. Själva denoiseringsvägen följer geodeter som spårar energiminimering, inte godtyckliga raka linjer genom kartesiskt rum.
Resultaten når den tröskel som är viktig: kemisk noggrannhet, definierad som energifel under 1 kcal/mol. På QM9-benchmarken uppnår den Riemannska modellen ett medianfel på 0,177 kcal/mol – ungefär 20× bättre än kraftfältsstartstrukturer och betydligt bättre än den euklidiska versionen. När dessa prognoser används som utgångspunkt för DFT-förfining minskar beräkningskostnaden med mer än hälften.
Den djupare poängen: i molekylmodellering är representationsrummets geometri inte neutral. Euklidisk rum behandlar alla atomära förskjutningar som ekvivalenta; Riemannskt rum kan koda fysiken. När du justerar geometriskt avstånd med energikostnaden blir denoising optimering, och modellen lär sig att följa den potentiella energiytan istället för att kämpa emot den.
Papper:

Topp
Rankning
Favoriter
