トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jorge Bravo Abad
物理学@UAM_Madrid教授 |教授。材料AIラボのPI |材料向けAI研究所所長。
生成AIはX線回折パターンから直接MOF構造を解読します
金属有機フレーム(MOFs)は非常に有用な材料であり、多孔質で調整可能で、ガス貯蔵から薬物輸送まであらゆる用途に応用可能です。しかし、粉末X線回折データから構造を特定することは依然としてボトルネックであり、特に専門家にすべてのパターンを手動で解釈させることができない自動化された研究所ではなおさらです。
核心的な問題は、MOFは複雑な三次元ネットワークに配置された数百の原子を含み得ることです。XRD解釈の標準的なアプローチは、ピークの重複や構造的多様性の高さに苦労しています。
Bin Feng、Bingxu Wangらは、この問題を画像生成として再構築しています。彼らのモデルであるXrd2Mofは、XRDパターンをテキストプロンプトとして、MOF構造を生成する画像として扱い、Stable Diffusionアーキテクチャを適用してそれらの間のマッピングを学習します。
重要な洞察は粗い粒度分析です。すべての原子位置を予測しようとするのではなく、MOFをリンカー重心でつながれた金属ノードのネットワークとして表現しています。これは、XRDパターンの鋭いピークの多くが重金属原子から来ているため、うまく機能します。数百の原子を数十の接続点に還元することで、回折に実際に重要な構造情報を保持しつつ、問題を1桁に圧縮できます。
ケンブリッジ構造データベースの約8万個のMOF構造で訓練され、XRDパターンと正しい構造を一致させる確率は93%以上に達します。ほぼすべての既知のフレームワークトポロジーを網羅し、実験データで成功裏に検証します。
実際的な意味:自動駆動型研究所は、生の回折データから人間の介入なしに再構築された結晶構造へと移行できるようになり、これは自動化されたMOF発見パイプラインにはなかった機能です。
論文:

35
実験室で実際に作れるMOFを予測するための機械学習
金属有機フレームワーク(MOFs)は、金属ノードや有機リンカーから組み立てられた多孔質結晶であり、ガス貯蔵から触媒に至るまで応用できる、最も柔軟な材料の一つです。計算的には、数兆もの可能な構造を生成できます。問題は、ほとんどが合成されないことです。これまでに発表された数千件のMOFスクリーニングのうち、実際に実験室合成に至ったのは約12件だけで、それでも化学者は計算的に最適なものよりも既知の構造に似た「安全な」設計を選ぶ傾向があります。
アンドレ・ニヨンガボ・ルブンゴらは、このボトルネックに3つの要素を用いて対処しています。(1) MOFMinE、約100万MOFから65,000構造のサブセットを対象にシミュレーションされたひずみエネルギーと自由エネルギーを持つ新たにキュレーションされたデータセット;(2) MOFSeq(局所的特徴(構成要素のSMILES)とグローバル特徴(位相および連結性)の両方を符号化する列表現;そして(3) LLM-Prop。これは豊富なひずみエネルギーデータで事前学習され、より高価な自由エネルギー計算で微調整された3500万パラメータの言語モデルです。
その結果は驚くべきもので、平均絶対誤差は0.789 kJ/mol、合成可能性の予測精度は97%、競合構造の中から正しいポリモーフを選ぶ確率は78%です。たとえ2つのポリモーフがわずか0.16 kJ/molの差であっても、モデルは60%以上の確率で正しいものを選びます。
その意味は実際的です。かつては数日の分子シミュレーションが必要だったものが、今ではニューラルネットワークを通過して前進する形で行われているのです。これにより、計算MOFスクリーニングを予測合成可能性で定期的にフィルタリングする道が開かれ、実験者が「直感的」な設計を超えて未探索の化学空間領域に挑戦できるようになりつつ、コンピュータ上で良い見た目のものが実際に実験室で作れる可能性も高められます。
論文:

56
重要なものを失わずに高次ネットワークを圧縮する方法
多くの現実のシステムは単にペアワイズリンクだけでできているわけではありません。グループチャット、共著論文、教室、または生化学複合施設とは、3つ、4つ、あるいはそれ以上の存在が同時に参加するグループ相互作用のことです。ハイパーグラフはこれをモデル化する自然な方法です。エンティティ用のノードと各グループごとに「ハイパーエッジ」を配置し、ペア用にレイヤー、トリプル用、クアドラプル用にレイヤーを分けます。ただし、これらの高次のモデルはすぐに巨大化し、計算が難しく、解釈も難しくなります。重要な問いは、その高次の構造のうちどれだけが本当に新しい情報であり、どれだけが低次の情報と重複しているのか、ということです。
アレック・カークリー、ヘルシオ・フェリッペ、フェデリコ・バティストンは、ハイパーグラフの構造的還元性という情報理論的概念を用いてこれに取り組んでいます。非常に高価なデータリンクを使って、より高次のネットワーク全体を送ろうとするようなことを想像してください。一つの選択肢は「ナイーブ」で、すべてのレイヤー(ペア、トリプル、4組タプルなど)を独立して送る方法です。彼らの代替案は賢く、少数の「代表的」レイヤーだけを送信し、残りのレイヤーは違いのみを使ってノイズの多いコピーとして記述します。順序間の構造が重なり合うほど(例えば、すべての2体・3体相互作用が5体相互作用によってすでに暗示されている場合)、より多く圧縮できます。
これを0(圧縮性なし)から1(完全入れ子で完全還元可能)の間の正規化されたスコアη、冗長でない相互作用サイズのみを保持する明示的な縮小モデルに変換します。論文の図は、4層ハイパーグラフを最適に2層にまで縮小しつつ、本質的な高次の組織を捉えることができる簡単な例を示しています。
その後、合成データと実際のデータでストレステストを行います。制御された「ネスト型」トイハイパーグラフでは、ランダム性を注入するにつれてηが滑らかに減少し、「完璧構造」から「完全ランダム」へダイヤルのように振る舞います。実際のシステム(共著者、連絡ネットワーク、メールスレッド、タグ付けシステムなど)では、多くのものが驚くほど圧縮可能であることがわかります。複数のハイパーエッジオーダーを削り、レイヤーの一部だけを保持できますが、グローバルな接続性、コミュニティ構造、さらにはネットワーク上での高次の有権者モデルの挙動まで維持できます。
要するに、複雑なシステムを研究するのに、複雑で扱いにくい高次の記述は必ずしも必要ないことが多いです。適切な情報理論的視点があれば、どのグループサイズが本当に新しい構造を加え、はるかに小さなハイパーグラフを構築しつつ、あなたが関心を持つ集団的なパターンやダイナミクスを忠実に捉えているかを特定できます。
論文:

103
トップ
ランキング
お気に入り
