Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Autonom enkeltmolekylkjemi: når dyp forsterkningslæring bryter bindinger én om gangen
Å bryte en spesifikk kjemisk binding i ett enkelt molekyl – samtidig som naboene forblir urørt – er en av de vanskeligste tingene du kan gjøre i kjemi. En STM-spiss kan gjøre dette ved å injisere tunnelingselektroner på et nøyaktig sted, men disse eksperimentene krever en ekspert som manuelt justerer tuppens posisjon, biasspenning og strøm for hvert forsøk. For lite, og ingenting skjer; For mye og du ødelegger molekylet.
Zhiwen Zhu og medforfatterne demonstrerer nå en fullstendig autonom plattform som utfører flertrinns, båndselektive reaksjoner uten menneskelig inngripen. Deres system er et tetrabromert porfyrin (TPP-Br₄) på Au(111)—fire ekvivalente C–Br-bindinger rundt en porfyrinkjerne, dissosiert sekvensielt langs forhåndsdefinerte baner (ortho, para, ortho*, ortho-Z) gjennom ulike mellomprodukter.
Rørledningen har tre trinn. YOLOv7 nøkkelpunktdeteksjon og U-Net-segmentering lokaliserer molekyler og bestemmer orienteringen. En ResNet-18-klassifisator leser patcher rundt hvert bromsted for å kode molekylær tilstand som en 4-bits binær vektor. Deretter bestemmer en Soft Actor-Critic RL-agent spissplassering, spenning og strøm. Agenten interagerer direkte med STM via TCP, manipulerer, skanner på nytt og mottar lagdelte belønninger—positiv for korrekt enkeltbindingsspalting, negativ for ingen reaksjon, aktivering på feil sted eller degradering.
For å håndtere dataknapphet—bare 948 hendelser over 36 timer—utnytter de molekylets D₄h-symmetri gjennom invariant-transform opplevelsesgjenspilling, og genererer tilsvarende virtuelle baner uten ytterligere eksperimenter.
Agenten oppdager ekte fysikk. Optimal bias øker med hvert debrominasjonssteg (~2,5 V for den første bindingen, ~3,2 V for den siste), noe som reflekterer den utviklende elektroniske strukturen til radikalintermediater. Den plasserer spissen over målbindingene, i samsvar med romlig henfall av tunnel-elektron-eksitasjon, og tilpasser seg endringer i tuppens tilstand i sanntid. Suksessraten for enkeltsteg når 50–79 %, med full firetrinnsfullføring på 29–35 % – helt uten menneskelig veiledning.
Fra et ML-perspektiv navigerer algoritmen ekstreme begrensninger: små suksessområder, sparsomme støyende belønninger, ikke-stasjonære miljøer og irreversible feilmoduser. SACs entropiregularisering gir balanse i utforskning, mens symmetriforsterket gjenspilling forhindrer policy-kollaps.
Dette peker mot AI-agenter som aktivt utfører eksperimenter, og lærer optimale protokoller gjennom direkte interaksjon med fysiske systemer.
Artikkel:

Topp
Rangering
Favoritter
