Prediction of good reaction coordinates and future evolution of MD trajectories using Regularized Sparse Autoencoders: A novel deep learning approach

要約

反応座標(RC)の同定は、化学反応の進行を決定する上で重要な役割を果たすことから、活発な研究分野である。反応座標の選択はしばしば発見的知識に基づいている。しかし、その選択のための本質的な基準は、座標が反応物と生成物の両方の状態を明確に捉えることである。また、他の自由度が反応座標に沿って容易に平衡化できるように、座標は最も遅いものでなければならない。また、他のすべての自由度が反応座標に沿って容易に平衡化できるように、座標は最も遅いものでなければならない。我々は、エネルギーに基づくモデルである正則化スパースオートエンコーダーを用いて、反応座標の重要なセットを発見した。反応座標の発見とともに、我々のモデルは分子動力学(MD)軌道の進化も予測する。我々は、スパース性を強制する正則化を含めることで、小さいが重要な反応座標のセットを選択するのに役立つことを示した。我々は、アラニンジペプチド系とプロフラビンとDNA系の2つのモデル系を用いて、我々のアプローチを実証した。我々はMDの軌跡を多変量時系列としてモデル化し、我々の潜在変数モデルが多段階時系列予測のタスクを実行する。この考え方は、一般的なスパースコーディングアプローチにヒントを得たもので、各入力サンプルを代表的なパターンの集合から取り出した少数の要素の線形結合として表現する。

要約(オリジナル)

Identifying reaction coordinates(RCs) is an active area of research, given the crucial role RCs play in determining the progress of a chemical reaction. The choice of the reaction coordinate is often based on heuristic knowledge. However, an essential criterion for the choice is that the coordinate should capture both the reactant and product states unequivocally. Also, the coordinate should be the slowest one so that all the other degrees of freedom can easily equilibrate along the reaction coordinate. Also, the coordinate should be the slowest one so that all the other degrees of freedom can easily equilibrate along the reaction coordinate. We used a regularised sparse autoencoder, an energy-based model, to discover a crucial set of reaction coordinates. Along with discovering reaction coordinates, our model also predicts the evolution of a molecular dynamics(MD) trajectory. We showcased that including sparsity enforcing regularisation helps in choosing a small but important set of reaction coordinates. We used two model systems to demonstrate our approach: alanine dipeptide system and proflavine and DNA system, which exhibited intercalation of proflavine into DNA minor groove in an aqueous environment. We model MD trajectory as a multivariate time series, and our latent variable model performs the task of multi-step time series prediction. This idea is inspired by the popular sparse coding approach – to represent each input sample as a linear combination of few elements taken from a set of representative patterns.

arxiv情報

著者 Abhijit Gupta
発行日 2024-01-03 17:38:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, physics.chem-ph, q-bio.QM, stat.ME, stat.ML パーマリンク