Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Autonomní chemie jednotlivých molekul: když hluboké posilované učení přerušuje vazby jednu po druhé
Přerušit konkrétní chemickou vazbu v jedné molekule – a přitom nechat její sousedy nedotčené – je jedna z nejtěžších věcí, které můžete v chemii udělat. STM hrot to může udělat vstřikováním tunelovacích elektronů na přesné místo, ale tyto experimenty vyžadují odborníka, který ručně upravuje polohu hrotu, napětí předpětí a proud pro každý pokus. Příliš málo a nic se nestane; Příliš mnoho a molekulu zničíte.
Zhiwen Zhu a spoluautoři nyní demonstrují plně autonomní platformu, která provádí vícestupňové, bond-selectivní reakce bez lidského zásahu. Jejich systém je tetrabromovaný porfyrin (TPP-Br₄) na Au(111) – čtyři ekvivalentní C–Br vazby kolem porfyrinového jádra, které jsou postupně disociovány podél předem definovaných drah (ortho, para, ortho*, ortho-Z) přes různé meziprodukty.
Potrubí má tři fáze. Detekce klíčových bodů YOLOv7 a segmentace pomocí U-Net lokalizují molekuly a určují orientaci. Klasifikátor ResNet-18 čte záplaty kolem každého bromového místa a kóduje molekulární stav jako 4bitový binární vektor. Poté Soft Actor-Critic RL agent rozhoduje o umístění hrotu, napětí a proudu. Agent interaguje přímo se STM přes TCP, manipuluje, znovu skenuje a získává stupňovité odměny – pozitivní na správné štěpení jednovazné vazby, negativní na žádnou reakci, aktivaci na špatném místě nebo degradaci.
Aby se vyrovnali s nedostatkem dat – pouze 948 událostí během 36 hodin – využívají D₄h symetrii molekuly prostřednictvím invariantních transformačních opakování zkušeností, čímž generují ekvivalentní virtuální trajektorie bez dalších experimentů.
Agent objeví skutečnou fyziku. Optimální předpětí roste s každým krokem debrominace (~2,5 V pro první vazbu, ~3,2 V pro poslední), což odráží vyvíjející se elektronovou strukturu radikálových meziproduktů. Umisťuje špičku nad cílové vazby, což odpovídá prostorovému úbytku excitace tunelujících elektronů, a přizpůsobuje se změnám stavu špičky v reálném čase. Úspěšnost jednotlivých kroků dosahuje 50–79 %, plné dokončení čtyřkroků je 29–35 % – zcela bez lidského vedení.
Z pohledu strojového učení algoritmus zvládá extrémní omezení: malé oblasti úspěchu, řídké šumové odměny, nestacionární prostředí a nevratné režimy selhání. Regularizace entropie v SAC zajišťuje vyváženost průzkumu, zatímco symetriou vylepšené přehrávání zabraňuje kolapsu politiky.
To ukazuje na AI agenty, kteří aktivně provádějí experimenty a učí se optimální protokoly přímou interakcí s fyzickými systémy.
Článek:

Top
Hodnocení
Oblíbené
