Internal-Coordinate Density Modelling of Protein Structure: Covariance Matters

要約

タンパク質構造予測における最近の画期的な進歩の後、タンパク質機械学習に残された課題の 1 つは、構造状態の分布を確実に予測することです。
タンパク質鎖の自由度間の複雑な共分散構造のため、変動のパラメトリック モデルを適合させるのは難しく、多くの場合、モデルがローカルまたはグローバルな構造制約に違反する原因になります。
この論文では、内部座標でタンパク質密度をモデル化するための新しい戦略を紹介します。これは、3D 空間の制約を使用して内部自由度間の共分散構造を誘導します。
3D の条件付き平均によって暗示される制約によって引き起こされる完全な共分散出力を備えた変分オートエンコーダーを構築することによってこの手順の可能性を説明し、私たちのアプローチにより 2 つの設定で内部座標の密度モデルを完全なタンパク質骨格にスケーリングできることを示します。
: 1) 小さな変動と限られた量の利用可能なデータを示すタンパク質の単峰性設定、および 2) 高いデータ領域でのより大きな構造変化の多峰性設定。

要約(オリジナル)

After the recent ground-breaking advances in protein structure prediction, one of the remaining challenges in protein machine learning is to reliably predict distributions of structural states. Parametric models of fluctuations are difficult to fit due to complex covariance structures between degrees of freedom in the protein chain, often causing models to either violate local or global structural constraints. In this paper, we present a new strategy for modelling protein densities in internal coordinates, which uses constraints in 3D space to induce covariance structure between the internal degrees of freedom. We illustrate the potential of the procedure by constructing a variational autoencoder with full covariance output induced by the constraints implied by the conditional mean in 3D, and demonstrate that our approach makes it possible to scale density models of internal coordinates to full protein backbones in two settings: 1) a unimodal setting for proteins exhibiting small fluctuations and limited amounts of available data, and 2) a multimodal setting for larger conformational changes in a high data regime.

arxiv情報

著者 Marloes Arts,Jes Frellsen,Wouter Boomsma
発行日 2024-01-24 13:44:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM パーマリンク