Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Å bøye rommet for å matche energi: hvordan geometri får molekylstrukturprediksjon til kjemisk nøyaktighet
Å forutsi den tredimensjonale strukturen til et molekyl – nøyaktig hvor hvert atom befinner seg i rommet – er grunnleggende for beregningskjemi. Gjør du litt feil, kan energiberegningene dine være mye feil. Gullstandarden er tetthetsfunksjonalteori, men DFT er tregt og dyrt. Maskinlæring tilbyr en raskere løsning: tren en modell til å støydempe et grovt innledende gjetning til en nøyaktig struktur.
Problemet er at de fleste denotiserende modeller opererer i vanlig euklidsk rom, hvor alle retninger behandles likt. Men molekyler fungerer ikke slik. Å strekke en binding koster langt mer energi enn å rotere rundt den. Like avstander i kartesiske koordinater betyr ikke like energiendringer.
Jeheon Woo og medforfatterne tar opp denne uoverensstemmelsen direkte. De konstruerer en Riemannsk mangfoldighet—et krummet rom med en posisjonsavhengig metrikk—designet slik at geodetisk avstand korrelerer med energiforskjell. Metrikken er bygget opp fra fysikkbaserte interne koordinater som veier interatomære avstander etter hvor mye energi det koster å endre dem: stive bindinger teller mer enn myke torsjoner. Når de sammenligner geodetisk avstand med standard RMSD, hopper korrelasjonen med energi fra 0,37 til 0,90.
Å trene en støydempingsmodell på dette buede området endrer hva modellen lærer. I euklidsk rom kan tilsetning av isotrop støy bryte bindinger eller skape umulige geometrier—strukturer hundrevis av kcal/mol over minimum. På den Riemannske mangfoldigheten holder samme støystyrke molekylene kjemisk følbare, og holder seg innenfor samme potensialbrønn. Selve denoiseringsbanen følger geodeter som sporer energiminimering, ikke vilkårlige rette linjer gjennom kartesisk rom.
Resultatene treffer terskelen som betyr noe: kjemisk nøyaktighet, definert som energifeil under 1 kcal/mol. På QM9-benchmarken oppnår den Riemannske modellen en medianfeil på 0,177 kcal/mol – omtrent 20 × bedre enn kraftfeltets startstrukturer og betydelig bedre enn den euklidske versjonen. Når disse prediksjonene brukes som utgangspunkt for DFT-forbedring, faller beregningskostnadene med mer enn halvparten.
Det dypere poenget: i molekylær modellering er ikke geometrien til representasjonsrommet nøytral. Euklidsk rom behandler alle atomforskyvninger som ekvivalente; Riemannsk rom kan kode fysikken. Når du justerer geometrisk avstand med energikostnad, blir denoising optimalisering, og modellen lærer å følge potensialenergiflaten i stedet for å kjempe mot den.
Artikkel:

Topp
Rangering
Favoritter
