要約
この論文では、2 つのノード間の関係を含むタスク (エッジ中心タスク) のための新しいグラフベースの深層学習モデルを紹介します。このモデルでは、ノードのプロパティ自体ではなく、ノードのペア間の関係と相互作用を予測することに重点が置かれています。
このモデルは、教師あり学習と自己教師あり学習を組み合わせ、埋め込みが学習した損失関数と、グランド トゥルースの有無にかかわらずパターンを考慮します。
さらに、ノードとエッジの両方の機能を活用するアテンション メカニズムが組み込まれています。
エンドツーエンドでトレーニングされたアーキテクチャは、埋め込み生成と予測という 2 つの主要コンポーネントで構成されます。
まず、グラフ ニューラル ネットワーク (GNN) は、生のノード フィーチャを、エッジ属性を組み込んだ高密度の低次元埋め込みに変換します。
次に、フィードフォワード ニューラル モデルがノードの埋め込みを処理して、最終出力を生成します。
実験により、私たちのモデルがタンパク質間相互作用予測およびジーンオントロジー (GO) 用語予測の既存の方法と一致またはそれを超えていることが実証されています。
このモデルは、ノード特徴のワンホット エンコーディングも効果的に実行し、未知の構造を持つ化合物間の類似性を予測するというこれまで未解決の問題の解決策を提供します。
要約(オリジナル)
This paper presents a novel graph-based deep learning model for tasks involving relations between two nodes (edge-centric tasks), where the focus lies on predicting relationships and interactions between pairs of nodes rather than node properties themselves. This model combines supervised and self-supervised learning, taking into account for the loss function the embeddings learned and patterns with and without ground truth. Additionally it incorporates an attention mechanism that leverages both node and edge features. The architecture, trained end-to-end, comprises two primary components: embedding generation and prediction. First, a graph neural network (GNN) transform raw node features into dense, low-dimensional embeddings, incorporating edge attributes. Then, a feedforward neural model processes the node embeddings to produce the final output. Experiments demonstrate that our model matches or exceeds existing methods for protein-protein interactions prediction and Gene Ontology (GO) terms prediction. The model also performs effectively with one-hot encoding for node features, providing a solution for the previously unsolved problem of predicting similarity between compounds with unknown structures.
arxiv情報
著者 | Eugenio Borzone,Leandro Di Persia,Matias Gerard |
発行日 | 2025-01-21 17:26:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google