Scoreformer: A Surrogate Model For Large-Scale Prediction of Docking Scores

要約

この研究では、分子ドッキング スコアを正確に予測し、それによって創薬におけるハイスループット仮想スクリーニング (HTVS) を最適化するように設計された新しいグラフ トランスフォーマー モデルである ScoreFormer を紹介します。
このアーキテクチャには、主近傍集約 (PNA) と学習可能なランダム ウォーク位置エンコーディング (LRWPE) が統合されており、複雑な分子構造とそれぞれのドッキング スコアとの関係を理解するモデルの能力が強化されています。
このアプローチは、より広範囲の化学空間をカバーし、パフォーマンスが向上しているため、回収率と効率の両方において、従来の HTVS 手法や最近のグラフ ニューラル ネットワーク (GNN) モデルを大幅に上回っています。
私たちの結果は、ScoreFormer がドッキング スコア予測において競争力のあるパフォーマンスを達成し、既存のモデルと比較して推論時間を大幅に 1.65 倍削減できることを示しています。
私たちは、さまざまな条件下で複数のデータセットにわたって ScoreFormer を評価し、潜在的な薬剤候補を迅速に特定する際の堅牢性と信頼性を確認しました。

要約(オリジナル)

In this study, we present ScoreFormer, a novel graph transformer model designed to accurately predict molecular docking scores, thereby optimizing high-throughput virtual screening (HTVS) in drug discovery. The architecture integrates Principal Neighborhood Aggregation (PNA) and Learnable Random Walk Positional Encodings (LRWPE), enhancing the model’s ability to understand complex molecular structures and their relationship with their respective docking scores. This approach significantly surpasses traditional HTVS methods and recent Graph Neural Network (GNN) models in both recovery and efficiency due to a wider coverage of the chemical space and enhanced performance. Our results demonstrate that ScoreFormer achieves competitive performance in docking score prediction and offers a substantial 1.65-fold reduction in inference time compared to existing models. We evaluated ScoreFormer across multiple datasets under various conditions, confirming its robustness and reliability in identifying potential drug candidates rapidly.

arxiv情報

著者 Álvaro Ciudad,Adrián Morales-Pastor,Laura Malo,Isaac Filella-Mercè,Victor Guallar,Alexis Molina
発行日 2024-06-13 17:31:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.BM パーマリンク