Screening of BindingDB database ligands against EGFR, HER2, Estrogen, Progesterone and NF-kB receptors based on machine learning and molecular docking

要約

乳がんは、世界中の女性の間で 2 番目に罹患しているがんであり、新たな治療法の探求が必要です。
乳がんの 4 つのサブグループ「ホルモン受容体陽性で HER2 陰性、ホルモン受容体陽性で HER2 陽性、ホルモン受容体陰性で HER2 陽性、ホルモン受容体陰性で HER2 陰性」の 4 つのサブグループを標的とすることが重要です。
EGFR、HER2、ER、NF-kB、PR などの特定の標的を阻害します。
この研究では、バイナリおよびマルチクラス分類のためのさまざまな方法を評価しました。
その中で、BindingDB データベースからのリガンドの仮想スクリーニング用に、精度 0.74、F1 スコア 0.73、AUC 0.94 の GA-SVM-SVM:GA-SVM-SVM モデルが選択されました。
このモデルは、BindingDB データベースから、それぞれ EGFR+HER2、ER、NF-kB、および PR のクラスの活性/不活性および標的予測の両方で 90% 以上の精度で 4454、803、438、および 378 個のリガンドを同定することに成功しました。
選択したリガンドに基づいて、ターゲットに基づいてさまざまなリガンドを分類する樹状図を作成しました。
この樹状図は、さまざまな治療標的の化学空間の探索を容易にすることを目的としています。
活性確率と正しい標的選択確率の積が 90% の閾値を超えたリガンドが、分子ドッキングを使用したさらなる調査のために選択されました。
これらのリガンドのそれぞれの標的に対する結合エネルギー範囲は、-15 ~ -5 kcal/mol であると計算されました。
最後に、医薬化学における一般的かつ共通の規則に基づいて、EGFR+HER2、ER、NF-kB、および PR クラスでのさらなる研究のための優先度の高い新しいリガンドをそれぞれ 2、3、3、および 8 つ選択しました。

要約(オリジナル)

Breast cancer, the second most prevalent cancer among women worldwide, necessitates the exploration of novel therapeutic approaches. To target the four subgroups of breast cancer ‘hormone receptor-positive and HER2-negative, hormone receptor-positive and HER2-positive, hormone receptor-negative and HER2-positive, and hormone receptor-negative and HER2-negative’ it is crucial to inhibit specific targets such as EGFR, HER2, ER, NF-kB, and PR. In this study, we evaluated various methods for binary and multiclass classification. Among them, the GA-SVM-SVM:GA-SVM-SVM model was selected with an accuracy of 0.74, an F1-score of 0.73, and an AUC of 0.94 for virtual screening of ligands from the BindingDB database. This model successfully identified 4454, 803, 438, and 378 ligands with over 90% precision in both active/inactive and target prediction for the classes of EGFR+HER2, ER, NF-kB, and PR, respectively, from the BindingDB database. Based on to the selected ligands, we created a dendrogram that categorizes different ligands based on their targets. This dendrogram aims to facilitate the exploration of chemical space for various therapeutic targets. Ligands that surpassed a 90% threshold in the product of activity probability and correct target selection probability were chosen for further investigation using molecular docking. The binding energy range for these ligands against their respective targets was calculated to be between -15 and -5 kcal/mol. Finally, based on general and common rules in medicinal chemistry, we selected 2, 3, 3, and 8 new ligands with high priority for further studies in the EGFR+HER2, ER, NF-kB, and PR classes, respectively.

arxiv情報

著者 Parham Rezaee,Shahab Rezaee,Malik Maaza,Seyed Shahriar Arab
発行日 2024-05-01 17:24:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.med-ph パーマリンク