Avaruuden taivuttaminen energian vastaamiseksi: miten geometria saa molekyylirakenteen ennusteen kemialliseen tarkkuuteen Molekyylin kolmiulotteisen rakenteen ennustaminen—missä kukin atomi tarkalleen sijaitsee avaruudessa—on laskennallisen kemian perusta. Jos menee hieman pieleen, energialaskelmat voivat olla paljon pielessä. Kultainen standardi on tiheysfunktionaalinen teoria, mutta DFT on hidas ja kallis. Koneoppiminen tarjoaa nopeamman reitin: kouluta malli poistamaan karkea alkuperäinen arvaus tarkaksi rakenteeksi. Ongelma on, että useimmat kohinanpoistomallit toimivat tavallisessa euklidisessa tilassa, jossa kaikkia suuntia käsitellään tasapuolisesti. Mutta molekyylit eivät toimi niin. Sidoksen venyttäminen maksaa paljon enemmän energiaa kuin sen ympärillä pyöriminen. Yhtä suuret etäisyydet karteesisissa koordinaateissa eivät tarkoita yhtä suuria energian muutoksia. Jeheon Woo ja hänen kanssakirjoittajansa käsittelevät tätä ristiriitaa suoraan. He rakentavat Riemannin moniston—kaarevan avaruuden, jossa on sijaintiriippuvainen metriikka—joka on suunniteltu siten, että geodeettinen etäisyys korreloi energiaeron kanssa. Metriikka perustuu fysiikkaan perustuviin sisäisiin koordinaatteihin, jotka painottavat atomien välisiä etäisyyksiä sen mukaan, kuinka paljon energiaa niiden muuttaminen maksaa: jäykät sidokset merkitsevät enemmän kuin pehmeät vääntöalueet. Kun he vertaavat geodeettista etäisyyttä tavalliseen RMSD:hen, korrelaatio energian kanssa hyppää 0,37:stä 0,90:een. Kohinanpoistomallin kouluttaminen tällä kaarevalla tilalla muuttaa sitä, mitä malli oppii. Euklidisessa avaruudessa isotrooppinen kohina voi rikkoa sidoksia tai luoda mahdottomia geometrioita—rakenteita, jotka ovat satoja kcal/mol minimiarvoja korkeampaa. Riemannin monistossa sama kohinan voimakkuus pitää molekyylit kemiallisesti herkkinä, pysyen samassa potentiaalikuopassa. Kohinan poistoreitti itsessään noudattaa geodeettisia, jotka seuraavat energian minimointia, eivät mielivaltaisia suoria viivoja karteesisessa tilassa. Tulokset saavuttivat tärkeän kynnyksen: kemiallisen tarkkuuden, joka määritellään energiavirheeksi alle 1 kcal/mol. QM9-vertailussa Riemannin malli saavuttaa mediaanivirheen 0,177 kcal/mol – noin 20× parempi kuin voimakentän aloitusrakenteet ja merkittävästi parempi kuin euklidinen versio. Kun näitä ennusteita käytetään lähtökohtina DFT:n tarkentamiselle, laskennallinen kustannus putoaa yli puoleen. Syvempi pointti: molekyylimallinnuksessa esitystilan geometria ei ole neutraali. Euklidinen avaruus käsittelee kaikkia atomien siirtymää ekvivalentteina; Riemannin avaruus voi koodata fysiikan. Kun geometrinen etäisyys sovitetaan energiakustannusten kanssa, kohinanpoisto muuttuu optimoinniksi, ja malli oppii seuraamaan potentiaalienergian pintaa sen sijaan, että taistelisi sitä vastaan. Artikkeli: