Positive-Unlabeled Node Classification with Structure-aware Graph Learning

要約

グラフ上のノードの分類は、多くのアプリケーションにおける重要な研究課題です。
現実世界のグラフ データ セットは、ほとんどの既存の研究で想定されているようにバランスがとれておらず、正確ではない可能性があります。
困難な設定は、ラベル付きノードがポジティブ ノードに制限される、ラベルなしポジティブ (PU) ノード分類です。
パンデミックの予測やネットワークの異常検出など、さまざまな用途に使用できます。
PU ノード分類に関する既存の研究では、重要な可能性があるグラフ構造内の情報が見落とされています。
この論文では、PU ノードの分類にグラフ構造をより適切に利用することを提案します。
我々はまず、より正確な監視を導入するためにグラフ内で均質性を使用する、距離を意識した PU 損失を提案します。
また、モデルをグラフ構造に合わせるための正則化も提案します。
理論的分析によると、提案された損失を最小限に抑えることは、ポジティブラベルとネガティブラベルの両方で予想される損失を最小限に抑えることにもつながります。
多様なグラフ データセットに対する広範な経験的評価により、既存の最先端の手法よりも優れたパフォーマンスが実証されています。

要約(オリジナル)

Node classification on graphs is an important research problem with many applications. Real-world graph data sets may not be balanced and accurate as assumed by most existing works. A challenging setting is positive-unlabeled (PU) node classification, where labeled nodes are restricted to positive nodes. It has diverse applications, e.g., pandemic prediction or network anomaly detection. Existing works on PU node classification overlook information in the graph structure, which can be critical. In this paper, we propose to better utilize graph structure for PU node classification. We first propose a distance-aware PU loss that uses homophily in graphs to introduce more accurate supervision. We also propose a regularizer to align the model with graph structure. Theoretical analysis shows that minimizing the proposed loss also leads to minimizing the expected loss with both positive and negative labels. Extensive empirical evaluation on diverse graph data sets demonstrates its superior performance over existing state-of-the-art methods.

arxiv情報

著者 Hansi Yang,Yongqi Zhang,Quanming Yao,James Kwok
発行日 2023-10-20 14:32:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク