FusionDTI: Fine-grained Binding Discovery with Token-level Fusion for Drug-Target Interaction

要約

創薬プロセスにおいて、薬物-標的相互作用(DTI)の予測は極めて重要である。近年のDTIモデルは、多様な薬物・ターゲットエンコーダからの表現が統合され、目覚ましい進歩を遂げているにもかかわらず、そのようなモデルでは、薬物とタンパク質間のきめ細かな相互作用、すなわち、特定の薬物原子(または部分構造)とタンパク質の主要アミノ酸の結合を捉えることに苦労することが多い。この問題を解決するために、本論文ではFusionDTIと呼ばれる新しいモデルを紹介します。このモデルはトークンレベルのFusionモジュールを使用し、Drug-Target Interactionのきめ細かい情報を効果的に学習します。特に、我々のFusionDTIモデルは、配列断片の無効性を緩和するために薬剤のSELFIES表現を使用し、構造情報におけるアミノ酸配列の限界に対処するために標的タンパク質の構造認識(SA)語彙を組み込み、さらに、薬剤と標的の複雑な情報を捕捉するためのエンコーダとして、大規模な生物医学データセットで広範囲に訓練された事前学習言語モデルを活用する。3つの有名なベンチマークデータセットを用いた実験により、我々の提案するFusionDTIモデルは、既存の7つの最新ベースラインと比較して、DTI予測において最高のパフォーマンスを達成することが示された。さらに、我々のケーススタディは、FusionDTIが潜在的な結合部位を強調し、DTI予測の説明可能性を高めることができることを示している。

要約(オリジナル)

Predicting drug-target interaction (DTI) is critical in the drug discovery process. Despite remarkable advances in recent DTI models through the integration of representations from diverse drug and target encoders, such models often struggle to capture the fine-grained interactions between drugs and protein, i.e. the binding of specific drug atoms (or substructures) and key amino acids of proteins, which is crucial for understanding the binding mechanisms and optimising drug design. To address this issue, this paper introduces a novel model, called FusionDTI, which uses a token-level Fusion module to effectively learn fine-grained information for Drug-Target Interaction. In particular, our FusionDTI model uses the SELFIES representation of drugs to mitigate sequence fragment invalidation and incorporates the structure-aware (SA) vocabulary of target proteins to address the limitation of amino acid sequences in structural information, additionally leveraging pre-trained language models extensively trained on large-scale biomedical datasets as encoders to capture the complex information of drugs and targets. Experiments on three well-known benchmark datasets show that our proposed FusionDTI model achieves the best performance in DTI prediction compared with seven existing state-of-the-art baselines. Furthermore, our case study indicates that FusionDTI could highlight the potential binding sites, enhancing the explainability of the DTI prediction.

arxiv情報

著者 Zhaohan Meng,Zaiqiao Meng,Ke Yuan,Iadh Ounis
発行日 2024-10-04 14:23:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, q-bio.BM, q-bio.QM パーマリンク