Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Chimica autonoma a singola molecola: quando l'apprendimento profondo per rinforzo rompe i legami uno alla volta
Rompe un legame chimico specifico in una singola molecola—mentre lascia intatti i suoi vicini—è una delle cose più difficili che si possano fare in chimica. Una punta STM può farlo iniettando elettroni di tunneling in una posizione precisa, ma questi esperimenti richiedono un esperto che regola manualmente la posizione della punta, la tensione di polarizzazione e la corrente per ogni tentativo. Troppo poco e non succede nulla; troppo e distruggi la molecola.
Zhiwen Zhu e i coautori dimostrano ora una piattaforma completamente autonoma che esegue reazioni selettive per legame in più fasi senza intervento umano. Il loro sistema è un porfirina tetrabromurata (TPP-Br₄) su Au(111)—quattro legami C–Br equivalenti attorno a un nucleo di porfirina, dissociati sequenzialmente lungo percorsi predefiniti (orto, para, orto*, orto-Z) attraverso diversi intermediari.
Il pipeline ha tre fasi. La rilevazione dei punti chiave YOLOv7 e la segmentazione U-Net localizzano le molecole e determinano l'orientamento. Un classificatore ResNet-18 legge le patch attorno a ciascun sito di bromo per codificare lo stato molecolare come un vettore binario a 4 bit. Poi un agente RL Soft Actor-Critic decide la posizione della punta, la tensione e la corrente. L'agente interagisce direttamente con l'STM tramite TCP, manipola, riscanalizza e riceve ricompense stratificate—positive per la corretta scissione di un singolo legame, negative per nessuna reazione, attivazione in un sito sbagliato o degrado.
Per far fronte alla scarsità di dati—solo 948 eventi in 36 ore—sfruttano la simmetria D₄ₕ della molecola attraverso il replay dell'esperienza di trasformazione invariante, generando traiettorie virtuali equivalenti senza esperimenti aggiuntivi.
L'agente scopre la fisica reale. La tensione ottimale aumenta con ogni passo di debromurazione (~2.5 V per il primo legame, ~3.2 V per l'ultimo), riflettendo la struttura elettronica in evoluzione degli intermediari radicali. Posiziona la punta sopra i legami target, coerente con il decadimento spaziale dell'eccitazione degli elettroni di tunneling, e si adatta ai cambiamenti delle condizioni della punta in tempo reale. I tassi di successo a singolo passo raggiungono il 50–79%, con il completamento totale di quattro passi al 29–35%—interamente senza guida umana.
Da una prospettiva di ML, l'algoritmo naviga in vincoli estremi: regioni di successo minuscole, ricompense rumorose sparse, ambienti non stazionari e modalità di fallimento irreversibili. La regolarizzazione dell'entropia di SAC fornisce un equilibrio di esplorazione, mentre il replay aumentato dalla simmetria previene il collasso della politica.
Questo punta verso agenti AI che conducono attivamente esperimenti, apprendendo protocolli ottimali dall'interazione diretta con sistemi fisici.
Carta:

Principali
Ranking
Preferiti
