Energy-Based Coarse-Graining in Molecular Dynamics: A Flow-Based Framework Without Data

要約

粗粒(CG)モデルは、分子シミュレーションの複雑さを減らすための効果的なルートを提供しますが、従来のアプローチは、長い全原子分子動力学(MD)軌道に大きく依存して、構成空間を適切にサンプリングします。
このデータ駆動型の依存関係は、訪問のない構成が結果のCGモデルから除外されたままであるため、精度と一般化可能性を制限します。
全原子のボルツマン分布を直接標的とする粗材を採取するためのデータのない生成フレームワークを導入します。
私たちのモデルは、メタスト可能な状態を捕捉するマルチモーダルの周辺密度に統計的に関連する遅い集団変数を含む構造化された潜在空間と、単純で単峰性の条件分布を持つ残りの自由度を表す高速変数を定義します。
完全な潜在空間から全原子構成空間までの潜在的に学習可能な生物的マップにより、分子構造の自動で正確な再構築が可能になります。
このモデルは、サンプリングされた軌跡ではなく原子間のポテンシャルのみに依存する、逆カルバック – 繰り返しの発散を最小限に抑えるエネルギーベースの目的を使用してトレーニングされます。
焼き戻しスキームは、トレーニングを安定させ、多様な構成の調査を促進するために使用されます。
訓練されると、このモデルは、偏りのないワンショットの平衡サンプルを生成できます。
2つの合成システム – ダブルウェルポテンシャルとガウス混合物のメソッドを検証します。
このモデルは、ボルツマン分布のすべての関連するモードをキャプチャし、原子構成を正確に再構築し、シミュレーションデータがすべてない物理的に意味のある粗粒表現を学習します。

要約(オリジナル)

Coarse-grained (CG) models offer an effective route to reducing the complexity of molecular simulations, yet conventional approaches depend heavily on long all-atom molecular dynamics (MD) trajectories to adequately sample configurational space. This data-driven dependence limits their accuracy and generalizability, as unvisited configurations remain excluded from the resulting CG model. We introduce a data-free generative framework for coarse-graining that directly targets the all-atom Boltzmann distribution. Our model defines a structured latent space comprising slow collective variables, which are statistically associated with multimodal marginal densities capturing metastable states, and fast variables, which represent the remaining degrees of freedom with simple, unimodal conditional distributions. A potentially learnable, bijective map from the full latent space to the all-atom configuration space enables automatic and accurate reconstruction of molecular structures. The model is trained using an energy-based objective that minimizes the reverse Kullback-Leibler divergence, relying solely on the interatomic potential rather than sampled trajectories. A tempering scheme is used to stabilize training and promote exploration of diverse configurations. Once trained, the model can generate unbiased, one-shot equilibrium all-atom samples. We validate the method on two synthetic systems-a double-well potential and a Gaussian mixture-as well as on the benchmark alanine dipeptide. The model captures all relevant modes of the Boltzmann distribution, accurately reconstructs atomic configurations, and learns physically meaningful coarse-grained representations, all without any simulation data.

arxiv情報

著者 Maximilian Stupp,P. S. Koutsourelakis
発行日 2025-04-29 17:05:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.chem-ph, physics.comp-ph パーマリンク