Finding Heterophilic Neighbors via Confidence-based Subgraph Matching for Semi-supervised Node Classification

要約

タイトル:ラベル付けされたノードのセミサプライズにおいて信頼度に基づくサブグラフマッチングによる異種の隣人を見つける

要約:

– GNNは多くのグラフベースのアプリケーションで強力であることが証明されているが、隣人ノードが異なるラベルを持つ異種の状況ではうまく汎化されない。
– そのため、ある一定のエッジが不均衡な状況を想定して、信頼度比を超パラメータとして使用して、この課題に対処するアルゴリズムを提案する。
– この2層のアルゴリズムでは、まずサブグラフマッチングを用いてエッジ係数を決定する補助モジュールを使用し、その後、修正されたラベル伝播メカニズムを持つGNNを適用して、エッジ係数を効果的に活用する。
– 具体的には、与えられた信頼度比に基づいて一定量のタスク非関連のエッジを特定し、残りのエッジを使用して、2つのノード間の類似性をサブグラフで測定するために広く使用されている最適輸送を使用する。
– 最後に、係数を補助情報としてGNNに使用してラベル伝播メカニズムを改善し、重量が小さい2つのノードが近づかないようにする。
– ベンチマークデータセット上の実験結果は、当社のモデルがオーバースムージングを緩和し、パフォーマンスを向上させることを示しています。

要約(オリジナル)

Graph Neural Networks (GNNs) have proven to be powerful in many graph-based applications. However, they fail to generalize well under heterophilic setups, where neighbor nodes have different labels. To address this challenge, we employ a confidence ratio as a hyper-parameter, assuming that some of the edges are disassortative (heterophilic). Here, we propose a two-phased algorithm. Firstly, we determine edge coefficients through subgraph matching using a supplementary module. Then, we apply GNNs with a modified label propagation mechanism to utilize the edge coefficients effectively. Specifically, our supplementary module identifies a certain proportion of task-irrelevant edges based on a given confidence ratio. Using the remaining edges, we employ the widely used optimal transport to measure the similarity between two nodes with their subgraphs. Finally, using the coefficients as supplementary information on GNNs, we improve the label propagation mechanism which can prevent two nodes with smaller weights from being closer. The experiments on benchmark datasets show that our model alleviates over-smoothing and improves performance.

arxiv情報

著者 Yoonhyuk Choi,Jiho Choi,Taewook Ko,Chong-Kwon Kim
発行日 2023-04-12 08:57:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, cs.SI パーマリンク