Espaloma-0.3.0: Machine-learned molecular mechanics force field for the simulation of protein-ligand systems and beyond

要約

分子力学 (MM) 力場 — 単純なペアおよび多項式の項によって分子システムのエネルギー状況を特徴付けるモデル — は伝統的に、人間の専門家が精選した、柔軟性に欠け、拡張性が低い離散的な化学パラメーターの割り当てルール、つまり原子または
価数のタイプ。
最近、グラフ ニューラル ネットワークを使用してこのプロセスを置き換え、量子化学計算または凝縮相データから直接エンドツーエンドの微分可能な方法でパラメータ化スキームを学習できるようにすることに大きな関心が集まっています。
この論文では、量子化学データに直接フィットするエネルギーと力の両方をトレーニング プロセスに組み込むことにより、Espaloma のエンドツーエンドの微分可能な力場構築アプローチを拡張します。
OpenMM SPICE データセットを基盤として、小分子、タンパク質、RNA をカバーする生体分子モデリングの幅広い関心に関連性の高い化学空間を含むデータセットを厳選しています。
結果として得られる力場、espaloma 0.3.0 は、これらの多様な生体分子種を自己矛盾なくパラメータ化し、量子化学エネルギーと力を正確に予測し、安定した量子化学エネルギー最小化幾何学構造を維持します。
驚くべきことに、この単純なアプローチは、タンパク質とリガンドを自己一貫してパラメータ化する際に、非常に正確なタンパク質-リガンド結合自由エネルギーを生成します。
このアプローチは、GPU 1 日で新しい力場を大規模な量子化学データセットに適合させることができ、関心のある新しい化学ドメインに簡単に拡張できる、体系的により正確な力場を構築するための前進の道として大きな期待を示しています。

要約(オリジナル)

Molecular mechanics (MM) force fields — the models that characterize the energy landscape of molecular systems via simple pairwise and polynomial terms — have traditionally relied on human expert-curated, inflexible, and poorly extensible discrete chemical parameter assignment rules, namely atom or valence types. Recently, there has been significant interest in using graph neural networks to replace this process, while enabling the parametrization scheme to be learned in an end-to-end differentiable manner directly from quantum chemical calculations or condensed-phase data. In this paper, we extend the Espaloma end-to-end differentiable force field construction approach by incorporating both energy and force fitting directly to quantum chemical data into the training process. Building on the OpenMM SPICE dataset, we curate a dataset containing chemical spaces highly relevant to the broad interest of biomolecular modeling, covering small molecules, proteins, and RNA. The resulting force field, espaloma 0.3.0, self-consistently parametrizes these diverse biomolecular species, accurately predicts quantum chemical energies and forces, and maintains stable quantum chemical energy-minimized geometries. Surprisingly, this simple approach produces highly accurate protein-ligand binding free energies when self-consistently parametrizing protein and ligand. This approach — capable of fitting new force fields to large quantum chemical datasets in one GPU-day — shows significant promise as a path forward for building systematically more accurate force fields that can be easily extended to new chemical domains of interest.

arxiv情報

著者 Kenichiro Takaba,Iván Pulido,Mike Henry,Hugo MacDermott-Opeskin,John D. Chodera,Yuanqing Wang
発行日 2023-07-13 23:00:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, physics.chem-ph パーマリンク