A DNN Biophysics Model with Topological and Electrostatic Features

要約

このプロジェクトでは、タンパク質の特性を予測するための深層学習ニューラル ネットワーク (DNN) ベースの生物物理学モデルを提供します。
このモデルは、タンパク質の構造情報と分子力学を支配する力場によって生成される、マルチスケールで均一なトポロジカルおよび静電的特徴を使用します。
トポロジー特徴は要素指定永続相同性 (ESPH) を使用して生成され、静電特徴はデカルト ツリーコードを使用して高速に計算されます。
これらの特徴は、さまざまなサイズのタンパク質に対して均一な数であるため、ネットワークのトレーニングに広く利用可能なタンパク質構造データベースを使用できます。
これらの機能はマルチスケールでもあるため、ユーザーは解像度と計算コストのバランスを取ることができます。
4,000 を超えるタンパク質構造に関する機械学習シミュレーションは、静電溶媒和エネルギーなどの生物物理学的特性を予測するためのタンパク質構造と力場を表現する際の、これらの特徴の効率と忠実性を示しています。
トポロジー機能または静電機能単独、および両方の組み合わせのテストでは、両方の機能を使用した場合に最適なパフォーマンスが得られることがわかりました。
このモデルは、理論計算と実験の両方からのデータを使用して、広範な生体分子の生物物理学的特性と機能予測を支援する一般的なツールとしての可能性を示しています。

要約(オリジナル)

In this project, we provide a deep-learning neural network (DNN) based biophysics model to predict protein properties. The model uses multi-scale and uniform topological and electrostatic features generated with protein structural information and force field, which governs the molecular mechanics. The topological features are generated using the element specified persistent homology (ESPH) while the electrostatic features are fast computed using a Cartesian treecode. These features are uniform in number for proteins with various sizes thus the broadly available protein structure database can be used in training the network. These features are also multi-scale thus the resolution and computational cost can be balanced by the users. The machine learning simulation on over 4000 protein structures shows the efficiency and fidelity of these features in representing the protein structure and force field for the predication of their biophysical properties such as electrostatic solvation energy. Tests on topological or electrostatic features alone and the combination of both showed the optimal performance when both features are used. This model shows its potential as a general tool in assisting biophysical properties and function prediction for the broad biomolecules using data from both theoretical computing and experiments.

arxiv情報

著者 Elyssa Sliheet,Md Abu Talha,Weihua Geng
発行日 2024-09-05 16:11:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math-ph, math.MP パーマリンク