Transferable Graph Neural Fingerprint Models for Quick Response to Future Bio-Threats


グラフ ニューラル フィンガープリントは、高スループットで忠実度の高い分子ドッキング サロゲートを開発するための有望な方法です。
この研究では、23 のコロナウイルスタンパク質標的に対する約 300,000 の薬剤候補からなる COVID-19 薬剤ドッキング データセットを構築しました。
このデータセットを使用して、高スループットの仮想 COVID-19 薬物スクリーニング用のグラフ ニューラル指紋ドッキング モデルをトレーニングしました。
グラフ ニューラル フィンガープリント モデルは、ドッキング ターゲットのほとんどについて平均二乗誤差が $0.21$ kcal/mol 未満であるドッキング スコアの高い予測精度をもたらし、従来の円形フィンガープリント法と比較して大幅な改善を示しています。
ターゲット固有のグラフ ニューラル フィンガープリント モデルと同等の精度を備えた転送可能なモデルは、優れたトレーニング効率とデータ効率を示します。


Fast screening of drug molecules based on the ligand binding affinity is an important step in the drug discovery pipeline. Graph neural fingerprint is a promising method for developing molecular docking surrogates with high throughput and great fidelity. In this study, we built a COVID-19 drug docking dataset of about 300,000 drug candidates on 23 coronavirus protein targets. With this dataset, we trained graph neural fingerprint docking models for high-throughput virtual COVID-19 drug screening. The graph neural fingerprint models yield high prediction accuracy on docking scores with the mean squared error lower than $0.21$ kcal/mol for most of the docking targets, showing significant improvement over conventional circular fingerprint methods. To make the neural fingerprints transferable for unknown targets, we also propose a transferable graph neural fingerprint method trained on multiple targets. With comparable accuracy to target-specific graph neural fingerprint models, the transferable model exhibits superb training and data efficiency. We highlight that the impact of this study extends beyond COVID-19 dataset, as our approach for fast virtual ligand screening can be easily adapted and integrated into a general machine learning-accelerated pipeline to battle future bio-threats.


著者 Wei Chen,Yihui Ren,Ai Kagawa,Matthew R. Carbone,Samuel Yen-Chi Chen,Xiaohui Qu,Shinjae Yoo,Austin Clyde,Arvind Ramanathan,Rick L. Stevens,Hubertus J. J. van Dam,Deyu Lu
発行日 2023-09-15 00:53:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.LG, I.2.1, q-bio.BM パーマリンク