Multimodal Contrastive Representation Learning in Augmented Biomedical Knowledge Graphs


バイオメディカル知識グラフ(BKG)は、バイオメディカル分野における複雑な関係を解明するために、多様なデータセットを統合したものである。これらのグラフを効果的にリンク予測することで、潜在的な新薬-疾患関係などの貴重なつながりを発見することができる。本論文では、リンク予測を効果的に行うために、知識グラフ埋め込み(KGE)モデルを使用しながら、エンティティ内の関係を強化するために、特殊な言語モデル(LM)からの埋め込みをグラフ対照学習(GCL)と統合する新しいマルチモーダルアプローチを紹介する。既存のBKGの限界に対処するために、我々は、各エンティティタイプの生物学的配列とテキスト記述を含むマルチモーダルデータを組み込んだエンリッチ知識グラフであるPrimeKG++を提示する。意味情報と関係情報を統合表現することにより、我々のアプローチは強い汎用性を示し、未見のノードに対しても正確なリンク予測を可能にする。PrimeKG++とDrugBank薬剤-標的相互作用データセットを用いた実験結果は、多様な生物医学データセットにおける本手法の有効性と頑健性を実証している。ソースコード、訓練済みモデル、データは で公開されている。


Biomedical Knowledge Graphs (BKGs) integrate diverse datasets to elucidate complex relationships within the biomedical field. Effective link prediction on these graphs can uncover valuable connections, such as potential novel drug-disease relations. We introduce a novel multimodal approach that unifies embeddings from specialized Language Models (LMs) with Graph Contrastive Learning (GCL) to enhance intra-entity relationships while employing a Knowledge Graph Embedding (KGE) model to capture inter-entity relationships for effective link prediction. To address limitations in existing BKGs, we present PrimeKG++, an enriched knowledge graph incorporating multimodal data, including biological sequences and textual descriptions for each entity type. By combining semantic and relational information in a unified representation, our approach demonstrates strong generalizability, enabling accurate link predictions even for unseen nodes. Experimental results on PrimeKG++ and the DrugBank drug-target interaction dataset demonstrate the effectiveness and robustness of our method across diverse biomedical datasets. Our source code, pre-trained models, and data are publicly available at


著者 Tien Dang,Viet Thanh Duy Nguyen,Minh Tuan Le,Truong-Son Hy
発行日 2025-01-03 05:29:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.CL, cs.LG パーマリンク