VIGraph: Self-supervised Learning for Class-Imbalanced Node Classification


グラフ データのクラスの不均衡は、ノードの分類に重大な課題をもたらします。
SMOTE ベースのアプローチに代表される既存の方法は、この問題を部分的に軽減しますが、不均衡なシナリオ構築時には依然として制限が生じます。
自己教師あり学習 (SSL) は、データ自体から少数ノードを合成することで有望なソリューションを提供しますが、その可能性はまだ解明されていません。
このペーパーでは、SMOTE ベースのアプローチの限界を分析し、変分推論 (VI) を活用して少数派ノードを生成する自己教師あり変分グラフ自動エンコーダー (VGAE) に基づく新しい SSL モデルである VIGraph を紹介します。
具体的には、VIGraph は不均衡なグラフを構築する際に不均衡の概念を厳密に遵守し、生成 VGAE を利用して少数ノードを生成します。
さらに、VIGraph は、デコード段階で新しいシャム コントラスト戦略を導入し、生成されたノードの全体的な品質を向上させます。
VIGraph は、元のグラフに再統合することなく高品質のノードを生成できるため、SMOTE ベースのメソッドに見られる「生成、再統合、再トレーニング」プロセスが不要になります。
複数の実世界のデータセットでの実験により、VIGraph がクラスの不均衡なノード分類タスクに対して有望な結果を達成できることが実証されました。


Class imbalance in graph data poses significant challenges for node classification. Existing methods, represented by SMOTE-based approaches, partially alleviate this issue but still exhibit limitations during imbalanced scenario construction. Self-supervised learning (SSL) offers a promising solution by synthesizing minority nodes from the data itself, yet its potential remains unexplored. In this paper, we analyze the limitations of SMOTE-based approaches and introduce VIGraph, a novel SSL model based on the self-supervised Variational Graph Auto-Encoder (VGAE) that leverages Variational Inference (VI) to generate minority nodes. Specifically, VIGraph strictly adheres to the concept of imbalance when constructing imbalanced graphs and utilizes the generative VGAE to generate minority nodes. Moreover, VIGraph introduces a novel Siamese contrastive strategy at the decoding phase to improve the overall quality of generated nodes. VIGraph can generate high-quality nodes without reintegrating them into the original graph, eliminating the ‘Generating, Reintegrating, and Retraining’ process found in SMOTE-based methods. Experiments on multiple real-world datasets demonstrate that VIGraph achieves promising results for class-imbalanced node classification tasks.


著者 Yulan Hu,Sheng Ouyang,Zhirui Yang,Yong Liu
発行日 2023-11-02 12:36:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.LG パーマリンク