要約
機械学習力フィールド(MLFF)は、計算効率が改善されたAB Initioレベルでの分子のポテンシャルエネルギー表面を正確に記述することを約束します。
MLFF内では、Equivariant Graph Neural Networks(EQNNS)は、正確性とパフォーマンスに大きな可能性を示しており、この作業の焦点です。
自由エネルギー表面(FES)を回復するEQNNの能力は、まだ徹底的に調査されていない。
この作業では、ブタンおよびアラニンジペプチド(ADP)のFESを予測するEQNNSの精度に関するトレーニングデータ内の集合変数(CVS)分布の影響を調査します。
一般化可能なワークフローが提示され、トレーニング構成は古典的な分子動力学シミュレーションで生成され、AB initio計算でエネルギーと力が得られます。
トレーニングデータの結合と角度の制約が、理論の古典的およびAB initioレベルの両方で分子のFESを再現する際のEQNN力場の精度にどのように影響するかを評価します。
結果は、トレーニングデータにシステムのFESの特性領域からの構成が含まれていることを考えると、トレーニング中のサンプルCVSの分布によってモデルの精度が影響を受けないことを示しています。
ただし、トレーニングデータが古典的なシミュレーションから取得されると、EQNNは、自由エネルギーの高い構成の自由エネルギーを外挿するのに苦労しています。
対照的に、AB Initioデータで同じ構成でトレーニングされたモデルは、外挿の精度が向上したことを示しています。
調査結果は、eqNNSの包括的なトレーニングデータセットを作成して、FESSを予測し、システムのFESの事前知識の重要性を強調することの難しさを強調しています。
要約(オリジナル)
Machine learning force fields (MLFFs) promise to accurately describe the potential energy surface of molecules at the ab initio level of theory with improved computational efficiency. Within MLFFs, equivariant graph neural networks (EQNNs) have shown great promise in accuracy and performance and are the focus of this work. The capability of EQNNs to recover free energy surfaces (FES) remains to be thoroughly investigated. In this work, we investigate the impact of collective variables (CVs) distribution within the training data on the accuracy of EQNNs predicting the FES of butane and alanine dipeptide (ADP). A generalizable workflow is presented in which training configurations are generated with classical molecular dynamics simulations, and energies and forces are obtained with ab initio calculations. We evaluate how bond and angle constraints in the training data influence the accuracy of EQNN force fields in reproducing the FES of the molecules at both classical and ab initio levels of theory. Results indicate that the model’s accuracy is unaffected by the distribution of sampled CVs during training, given that the training data includes configurations from characteristic regions of the system’s FES. However, when the training data is obtained from classical simulations, the EQNN struggles to extrapolate the free energy for configurations with high free energy. In contrast, models trained with the same configurations on ab initio data show improved extrapolation accuracy. The findings underscore the difficulties in creating a comprehensive training dataset for EQNNs to predict FESs and highlight the importance of prior knowledge of the system’s FES.
arxiv情報
著者 | Orlando A. Mendible,Jonathan K. Whitmer,Yamil J. Colón |
発行日 | 2025-05-14 14:50:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google