要約
分子システムの準安定状態間の遷移経路を理解することは、材料設計と創薬の基礎です。
ただし、分子動力学シミュレーションを介してこれらの経路をサンプリングすることは、準安定状態間には高いエネルギー障壁があるため、計算コストが非常に高くなります。
最近の機械学習アプローチは、多くの場合、単純なシステムに限定されているか、高価なドメイン知識から抽出された集合変数 (CV) に依存しています。
この研究では、生成フロー ネットワーク (GFlowNets) を活用して、CV に依存せずに遷移パスをサンプリングすることを提案します。
この問題を分子軌道にわたる償却エネルギーベースのサンプリングとして再定式化し、GFlowNets のフローマッチング目標から導出される、ターゲット分布とジェネレーター間の二乗対数比を最小化することによってバイアスポテンシャルをトレーニングします。
3 つのタンパク質 (アラニン ジペプチド、ポリプロリン、シニョリン) に対する私たちの評価は、TPS-GFN と呼ばれる私たちのアプローチが、以前の CV フリーの機械学習アプローチよりも現実的で多様な遷移パスを生成することを示しています。
要約(オリジナル)
Understanding transition paths between meta-stable states in molecular systems is fundamental for material design and drug discovery. However, sampling these paths via molecular dynamics simulations is computationally prohibitive due to the high-energy barriers between the meta-stable states. Recent machine learning approaches are often restricted to simple systems or rely on collective variables (CVs) extracted from expensive domain knowledge. In this work, we propose to leverage generative flow networks (GFlowNets) to sample transition paths without relying on CVs. We reformulate the problem as amortized energy-based sampling over molecular trajectories and train a bias potential by minimizing the squared log-ratio between the target distribution and the generator, derived from the flow matching objective of GFlowNets. Our evaluation on three proteins (Alanine Dipeptide, Polyproline, and Chignolin) demonstrates that our approach, called TPS-GFN, generates more realistic and diverse transition paths than the previous CV-free machine learning approach.
arxiv情報
著者 | Kiyoung Seong,Seonghyun Park,Seonghwan Kim,Woo Youn Kim,Sungsoo Ahn |
発行日 | 2024-05-31 17:18:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google