Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Autonome enkel-molecuul chemie: wanneer diepe versterkende leren bindingen één voor één breekt
Een specifieke chemische binding in een enkel molecuul breken—terwijl de buren onaangetast blijven—is een van de moeilijkste dingen die je kunt doen in de chemie. Een STM-tips kan dit doen door tunneling-elektronen op een precieze locatie in te spuiten, maar deze experimenten vereisen een expert die de positie van de tip, de bias-spanning en de stroom voor elke poging handmatig aanpast. Te weinig en er gebeurt niets; te veel en je vernietigt het molecuul.
Zhiwen Zhu en co-auteurs demonstreren nu een volledig autonoom platform dat multi-stap, binding-selectieve reacties uitvoert zonder menselijke tussenkomst. Hun systeem is een tetrabrominated porfyrine (TPP-Br₄) op Au(111)—vier equivalente C–Br bindingen rond een porfyrinekern, die sequentieel worden gedissocieerd langs vooraf gedefinieerde paden (ortho, para, ortho*, ortho-Z) via verschillende intermediairen.
De pijplijn heeft drie fasen. YOLOv7 keypoint-detectie en U-Net segmentatie lokaliseren moleculen en bepalen de oriëntatie. Een ResNet-18 classifier leest patches rond elke broomlocatie om de moleculaire toestand als een 4-bits binaire vector te coderen. Vervolgens beslist een Soft Actor-Critic RL-agent over de plaatsing van de tip, spanning en stroom. De agent interacteert direct met de STM via TCP, manipuleert, scant opnieuw en ontvangt gelaagde beloningen—positief voor correcte enkel-binding cleaving, negatief voor geen reactie, verkeerde locatie-activatie of degradatie.
Om om te gaan met datatekort—slechts 948 gebeurtenissen over 36 uur—benutten ze de D₄ₕ-symmetrie van het molecuul door invariant-transform ervaring replay, waardoor equivalente virtuele trajecten worden gegenereerd zonder extra experimenten.
De agent ontdekt echte fysica. Optimale bias neemt toe met elke debrominatiestap (~2,5 V voor de eerste binding, ~3,2 V voor de laatste), wat de evoluerende elektronische structuur van radicale intermediairen weerspiegelt. Het plaatst de tip boven de doelbindingen, consistent met de ruimtelijke afname van tunneling-elektron-excitatie, en past zich in real-time aan aan veranderingen in de tipconditie. De succespercentages voor enkele stappen bereiken 50–79%, met een volledige vier-stap voltooiing van 29–35%—volledig zonder menselijke begeleiding.
Vanuit een ML-perspectief navigeert het algoritme door extreme beperkingen: kleine succesgebieden, schaarse ruisbeloningen, niet-stationaire omgevingen en onomkeerbare faalmodi. SAC's entropieregularisatie biedt een balans in verkenning, terwijl symmetrie-versterkte replay beleidsinstorting voorkomt.
Dit wijst op AI-agenten die actief experimenten uitvoeren, optimale protocollen leren van directe interactie met fysieke systemen.
Paper:

Boven
Positie
Favorieten
