トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
自律的単分子化学:深層強化学習が結合を一つずつ断つとき
単一の分子で特定の化学結合を切断しつつ、隣接する分子を傷つけずに保存することは、化学において最も難しいことの一つです。STMチップは、トンネル電子を正確な位置に注入することで可能ですが、これらの実験には専門家が毎回手動でチップの位置、バイアス電圧、電流を調整しる必要があります。少なすぎると何も起こりません。過剰だと分子が破壊されます。
朱志文らは現在、人間の介入なしに多段階の結合選択反応を行う完全自律型プラットフォームを実証しています。そのシステムはAu(111)上の四亜銅化ポルフィリン(TPP-Br₄)であり、ポルフィリンコアの周囲に4つの等価なC–Br結合があり、あらかじめ定められた経路(オルト、パラ、オルト*、オルトZ)に沿って異なる中間体を経由して順次解離しています。
パイプラインは3段階に分かれています。YOLOv7キーポイント検出とU-Net分割は分子を特定し、配向を決定します。ResNet-18分類器は各臭素部位の周囲のパッチを読み取り、分子状態を4ビットの二進ベクターとして符号化します。その後、ソフトアクター・クリティックRLエージェントが先端の位置、電圧、電流を決定します。エージェントはTCPを介してSTMと直接相互作用し、操作、再スキャンを行い、段階的な報酬を受け取ります。正当な単結合切断、反応なし、誤位置活性化、劣化は否定的報酬です。
データの希少性(36時間で948件のイベントのみ)に対応するため、彼らは不変変換経験再生を通じて分子のD₄h対称性を利用し、追加の実験なしで同等の仮想軌道を生成します。
エージェントは実際の物理学を発見します。最適なバイアスは脱硫化ステップごとに増加します(最初の結合は~2.5 V、最後の結合は~3.2 V)これは、ラジカル中間体の電子構造の進化を反映しています。これはトンネル電子励起の空間的崩壊と一致し、先端の条件変化にリアルタイムで適応します。シングルステップの成功率は50〜79%に達し、完全な4ステップ完了率は29〜35%で、完全に人間の指導なしです。
機械学習の観点から見ると、このアルゴリズムは極めて厳しい制約を乗り越えています。すなわち、小さな成功領域、まばらでノイズのある報酬、非定常環境、そして不可逆的な失敗モードです。SACのエントロピー正則化は探索のバランスを提供し、対称性強化リプレイは政策崩壊を防ぎます。
これは、物理システムとの直接的な相互作用から最適なプロトコルを学習し、実験を積極的に行うAIエージェントの存在を示しています。
論文:

トップ
ランキング
お気に入り
