From Peptides to Nanostructures: A Euclidean Transformer for Fast and Stable Machine Learned Force Fields

要約

近年、ab-initio 参照計算に基づいた機械学習力場 (MLFF) の開発が大幅に進歩しました。
低いテストエラーを達成しているにもかかわらず、分子動力学 (MD) シミュレーションにおける MLFF の信頼性は、シミュレーションのタイムスケールが延長された場合の不安定性に関する懸念から、ますます厳しい監視に直面しています。
私たちの発見は、累積不正確さに対する堅牢性とMLFFでの等変表現の使用との間に潜在的な関連性があることを示唆していますが、これらの表現に関連する計算コストにより、実際にはこの利点が制限される可能性があります。
これに対処するために、私たちは、疎な等変表現 (ユークリッド変数) と、不変情報と等変情報を分離するセルフアテンション メカニズムを組み合わせて、高価なテンソル積の必要性を排除する、SO3krates と呼ばれる変換アーキテクチャを提案します。
SO3krates は、精度、安定性、速度の独自の組み合わせを実現し、長時間およびシステム サイズのスケールでの物質の量子特性の洞察力に富んだ分析を可能にします。
この機能を実証するために、柔軟なペプチドと数百の原子を含む超分子構造の安定した MD 軌道を生成します。
さらに、数千の最小値を探索することにより、中程度の大きさの鎖状分子(例えば、小さなペプチド)のPESトポロジーを調査します。
注目すべきことに、SO3krates は、安定性という相反する要求と、トレーニング データを超えた新たな最小エネルギー構造の出現との間でバランスを取る能力を示しており、これは生化学分野における現実的な探索タスクにとって重要です。

要約(オリジナル)

Recent years have seen vast progress in the development of machine learned force fields (MLFFs) based on ab-initio reference calculations. Despite achieving low test errors, the reliability of MLFFs in molecular dynamics (MD) simulations is facing growing scrutiny due to concerns about instability over extended simulation timescales. Our findings suggest a potential connection between robustness to cumulative inaccuracies and the use of equivariant representations in MLFFs, but the computational cost associated with these representations can limit this advantage in practice. To address this, we propose a transformer architecture called SO3krates that combines sparse equivariant representations (Euclidean variables) with a self-attention mechanism that separates invariant and equivariant information, eliminating the need for expensive tensor products. SO3krates achieves a unique combination of accuracy, stability, and speed that enables insightful analysis of quantum properties of matter on extended time and system size scales. To showcase this capability, we generate stable MD trajectories for flexible peptides and supra-molecular structures with hundreds of atoms. Furthermore, we investigate the PES topology for medium-sized chainlike molecules (e.g., small peptides) by exploring thousands of minima. Remarkably, SO3krates demonstrates the ability to strike a balance between the conflicting demands of stability and the emergence of new minimum-energy conformations beyond the training data, which is crucial for realistic exploration tasks in the field of biochemistry.

arxiv情報

著者 J. Thorben Frank,Oliver T. Unke,Klaus-Robert Müller,Stefan Chmiela
発行日 2024-02-16 15:54:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.chem-ph パーマリンク