A GAN Approach for Node Embedding in Heterogeneous Graphs Using Subgraph Sampling

要約

私たちの研究は、グラフ ニューラル ネットワーク (GNN) を使用して、異種グラフにおけるクラスの不均衡の問題に対処します。
私たちは、敵対的生成ネットワーク (GAN) と GNN の長所を組み合わせて、データセットのバランスを効果的にとる合成ノードとエッジを作成する新しい方法を提案します。
このアプローチは、データ レベルでの不均衡を直接ターゲットにして修正します。
提案されたフレームワークは、データ生成中のグラフ構造の無視や、下流タスクで GNN ベースの分類器で使用できる合成構造の作成などの問題を解決します。
ノードとエッジの情報を同時に処理し、ノードの拡張とサブグラフのサンプリングを通じてエッジのバランスを改善します。
さらに、私たちのフレームワークにはしきい値戦略が統合されており、時間のかかるパラメーター調整を行わずにトレーニング中に最適なエッジしきい値を決定するのに役立ちます。
Amazon と Yelp Review データセットでの実験では、特に少数派ノードの識別において、私たちが提案したフレームワークの有効性が強調されており、主要なパフォーマンス指標全体でベースライン モデルを常に上回っており、現場での可能性を実証しています。

要約(オリジナル)

Our research addresses class imbalance issues in heterogeneous graphs using graph neural networks (GNNs). We propose a novel method combining the strengths of Generative Adversarial Networks (GANs) with GNNs, creating synthetic nodes and edges that effectively balance the dataset. This approach directly targets and rectifies imbalances at the data level. The proposed framework resolves issues such as neglecting graph structures during data generation and creating synthetic structures usable with GNN-based classifiers in downstream tasks. It processes node and edge information concurrently, improving edge balance through node augmentation and subgraph sampling. Additionally, our framework integrates a threshold strategy, aiding in determining optimal edge thresholds during training without time-consuming parameter adjustments. Experiments on the Amazon and Yelp Review datasets highlight the effectiveness of the framework we proposed, especially in minority node identification, where it consistently outperforms baseline models across key performance metrics, demonstrating its potential in the field.

arxiv情報

著者 Hung Chun Hsu,Bo-Jun Wu,Ming-Yi Hong,Che Lin,Chih-Yu Wang
発行日 2023-12-11 16:52:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.SI パーマリンク