Target Specific De Novo Design of Drug Candidate Molecules with Graph Transformer-based Generative Adversarial Networks

要約

新薬候補分子の発見は、医薬品開発における最も基本的かつ重要なステップの 1 つです。
確率分布が与えられた合成データを作成する生成的深層学習モデルは、部分的に既知の空間から完全に新しいサンプルを選択する目的で開発されました。
生成モデルは、de novo 分子の設計に高い可能性を提供します。
ただし、それらが実際の医薬品開発パイプラインで役立つためには、これらのモデルが標的特異的分子を設計できる必要があります。これは、この分野の次のステップです。
この研究では、選択した標的タンパク質と相互作用する薬剤候補分子の de novo 設計のために、DrugGEN を提案します。
提案されたシステムは、化合物とタンパク質構造をグラフとして表し、グラフ変換器を含む直列に接続された 2 つの敵対的生成ネットワークを介してそれらを処理します。
DrugGEN は、ChEMBL からの化合物と標的特異的生物活性分子の大規模なデータセットを使用してトレーニングされ、AKT1 タンパク質に対する効果的かつ特異的な阻害分子を設計します。AKT1 タンパク質は、さまざまな種類のがんに対する治療法を開発するために非常に重要です。
基本的なベンチマークでは、DrugGEN モデルは他の方法と競合するか、より優れたパフォーマンスを発揮します。
ターゲット固有の生成パフォーマンスを評価するために、分子ドッキングとディープラーニングベースの生物活性予測を使用してさらに in silico 分析を実施しました。
結果は、de novo 分子が、ネイティブ リガンドのレベルで AKT1 タンパク質構造と相互作用する可能性が高いことを示しています。
DrugGEN を使用して、標的の特徴と実験的生物活性のデータセットが与えられれば、あらゆるドラッグ可能なタンパク質の完全に新規で効果的な標的特異的薬物候補分子を設計できます。
DrugGEN のコードベース、データセット、結果、トレーニング済みモデルは、https://github.com/HUBioDataLab/DrugGEN で入手できます。

要約(オリジナル)

Discovering novel drug candidate molecules is one of the most fundamental and critical steps in drug development. Generative deep learning models, which create synthetic data given a probability distribution, have been developed with the purpose of picking completely new samples from a partially known space. Generative models offer high potential for designing de novo molecules; however, in order for them to be useful in real-life drug development pipelines, these models should be able to design target-specific molecules, which is the next step in this field. In this study, we propose DrugGEN, for the de novo design of drug candidate molecules that interact with selected target proteins. The proposed system represents compounds and protein structures as graphs and processes them via serially connected two generative adversarial networks comprising graph transformers. DrugGEN is trained using a large dataset of compounds from ChEMBL and target-specific bioactive molecules, to design effective and specific inhibitory molecules against the AKT1 protein, which has critical importance for developing treatments against various types of cancer. On fundamental benchmarks, DrugGEN models have either competitive or better performance against other methods. To assess the target-specific generation performance, we conducted further in silico analysis with molecular docking and deep learning-based bioactivity prediction. Results indicate that de novo molecules have high potential for interacting with the AKT1 protein structure in the level of its native ligand. DrugGEN can be used to design completely novel and effective target-specific drug candidate molecules for any druggable protein, given target features and a dataset of experimental bioactivities. Code base, datasets, results and trained models of DrugGEN are available at https://github.com/HUBioDataLab/DrugGEN

arxiv情報

著者 Atabey Ünlü,Elif Çevrim,Ahmet Sarıgün,Hayriye Çelikbilek,Heval Ataş Güvenilir,Altay Koyaş,Deniz Cansen Kahraman,Ahmet Rifaioğlu,Abdurrahman Olğaç
発行日 2023-02-15 18:59:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM, q-bio.QM パーマリンク