4D Diffusion for Dynamic Protein Structure Prediction with Reference Guided Motion Alignment

要約

タンパク質の構造予測は、タンパク質の構造と機能の関係を理解し​​、生物学的研究を前進させ、医薬品の開発と実験計画を促進するために極めて重要です。
深層学習手法と実験的な 3D タンパク質構造の利用可能性の拡大により、構造予測が加速されていますが、タンパク質構造の動的な性質に対する注目は限定的です。
この研究では、動的タンパク質構造を学習するために分子動力学 (MD) シミュレーション データを組み込んだ革新的な 4D 拡散モデルを導入します。
私たちのアプローチは、次のコンポーネントによって区別されます。(1) 原子グループ化と側鎖二面角予測を利用して、主鎖と側鎖の両方を含む動的タンパク質構造を生成できる統合拡散モデル。
(2) 初期 3D タンパク質構造の潜在的な埋め込みを統合することで構造の一貫性を高める参照ネットワーク。
(3) 複数のタイムステップにわたる時間的構造の一貫性を改善することを目的とした動き調整モジュール。
私たちの知る限り、これは複数の時間ステップにわたるタンパク質の軌道を同時に予測することを目的とした最初の拡散ベースのモデルです。
ベンチマーク データセットでの検証により、このモデルが 32 タイム ステップにわたって最大 256 個のアミノ酸を含むタンパク質の動的 3D 構造を予測する際に高い精度を示し、安定状態での局所的な柔軟性と重大な構造変化の両方を効果的に捉えていることが実証されました。

要約(オリジナル)

Protein structure prediction is pivotal for understanding the structure-function relationship of proteins, advancing biological research, and facilitating pharmaceutical development and experimental design. While deep learning methods and the expanded availability of experimental 3D protein structures have accelerated structure prediction, the dynamic nature of protein structures has received limited attention. This study introduces an innovative 4D diffusion model incorporating molecular dynamics (MD) simulation data to learn dynamic protein structures. Our approach is distinguished by the following components: (1) a unified diffusion model capable of generating dynamic protein structures, including both the backbone and side chains, utilizing atomic grouping and side-chain dihedral angle predictions; (2) a reference network that enhances structural consistency by integrating the latent embeddings of the initial 3D protein structures; and (3) a motion alignment module aimed at improving temporal structural coherence across multiple time steps. To our knowledge, this is the first diffusion-based model aimed at predicting protein trajectories across multiple time steps simultaneously. Validation on benchmark datasets demonstrates that our model exhibits high accuracy in predicting dynamic 3D structures of proteins containing up to 256 amino acids over 32 time steps, effectively capturing both local flexibility in stable states and significant conformational changes.

arxiv情報

著者 Kaihui Cheng,Ce Liu,Qingkun Su,Jun Wang,Liwei Zhang,Yining Tang,Yao Yao,Siyu Zhu,Yuan Qi
発行日 2024-08-22 14:12:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク