CompassDock: Comprehensive Accurate Assessment Approach for Deep Learning-Based Molecular Docking in Inference and Fine-Tuning

要約

PDBBind などの分子ドッキングに使用されるデータセットには技術的な変動が含まれており、ノイズが多くなります。
ノイズの原因については議論されてきましたが、データセットの物理的、化学的、生物活性特性の包括的な分析はまだ不足しています。
このギャップに対処するために、私たちは総合正確評価 (コンパス) を導入します。
Compass には、リガンドのひずみエネルギー、タンパク質とリガンドの立体衝突、相互作用を調べる PoseCheck と、結合親和性エネルギーを計算するための新しい経験的スコアリング関数である AA-Score という 2 つの主要なコンポーネントが統合されています。
これらは一緒になって、リガンドの物理的/化学的特性と生物活性の好意性、およびタンパク質-リガンド相互作用の両方を評価する統合ワークフローを形成します。
Compass を使用した PDBBind データセットの分析により、グラウンド トゥルース データにかなりのノイズがあることが明らかになりました。
さらに、最先端の深層学習ベースの分子ドッキング手法である DiffDock を Compass モジュールに組み込んだ CompassDock を提案し、推論中にドッキングされたリガンドの正確な評価を可能にします。
最後に、コンパス スコアを使用して微調整することで分子ドッキング モデルのパフォーマンスを向上させるための新しいパラダイムを紹介します。コンパス スコアには、結合親和性エネルギー、ひずみエネルギー、および Compass によって特定される立体衝突の数が含まれます。
私たちの結果は、コンパスを使用せずに微調整すると、RMSD < 2{\AA} のドッキングポーズの割合が向上する一方で、物理的/化学的および生物活性の好感度が低下することを示しています。 対照的に、Compass を使用した微調整では、RMSD < 2{\AA} の改善は限られていますが、リガンド立体構造の物理的/化学的および生物活性の有利性が向上します。 ソース コードは https://github.com/BIMSBbioinfo/CompassDock で公開されています。

要約(オリジナル)

Datasets used for molecular docking, such as PDBBind, contain technical variability – they are noisy. Although the origins of the noise have been discussed, a comprehensive analysis of the physical, chemical, and bioactivity characteristics of the datasets is still lacking. To address this gap, we introduce the Comprehensive Accurate Assessment (Compass). Compass integrates two key components: PoseCheck, which examines ligand strain energy, protein-ligand steric clashes, and interactions, and AA-Score, a new empirical scoring function for calculating binding affinity energy. Together, these form a unified workflow that assesses both the physical/chemical properties and bioactivity favorability of ligands and protein-ligand interactions. Our analysis of the PDBBind dataset using Compass reveals substantial noise in the ground truth data. Additionally, we propose CompassDock, which incorporates the Compass module with DiffDock, the state-of-the-art deep learning-based molecular docking method, to enable accurate assessment of docked ligands during inference. Finally, we present a new paradigm for enhancing molecular docking model performance by fine-tuning with Compass Scores, which encompass binding affinity energy, strain energy, and the number of steric clashes identified by Compass. Our results show that, while fine-tuning without Compass improves the percentage of docked poses with RMSD < 2{\AA}, it leads to a decrease in physical/chemical and bioactivity favorability. In contrast, fine-tuning with Compass shows a limited improvement in RMSD < 2{\AA} but enhances the physical/chemical and bioactivity favorability of the ligand conformation. The source code is available publicly at https://github.com/BIMSBbioinfo/CompassDock.

arxiv情報

著者 Ahmet Sarigun,Vedran Franke,Bora Uyar,Altuna Akalin
発行日 2024-10-01 11:14:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.QM パーマリンク