Edge Classification on Graphs: New Directions in Topological Imbalance

要約

近年、グラフ機械学習 (GML) をノード/グラフの分類とリンク予測に適用することで目覚ましい成功を収めています。
しかし、ソーシャル ネットワーク分析やサイバーセキュリティなど、多くの実世界のアプリケーションで利用されているエッジ分類タスクは、大きな進歩を遂げていません。
このギャップに対処するために、私たちの研究はエッジ分類への包括的なアプローチを開拓しました。
私たちは、異なるクラスにわたるエッジの偏った分布から発生し、各エッジの局所サブグラフに影響を与え、エッジ分類のパフォーマンスに悪影響を与える、新しい「トポロジカル不均衡問題」を特定しました。
局所的な構造パターンが変化するとパフォーマンスの不一致が存在するというノード分類の最近の研究に触発され、トポロジー的に不均衡なエッジ分類におけるパフォーマンスの不一致も、局所クラス分布の分散を特徴付けることによって軽減できるかどうかを調査することを目的としています。
この課題を克服するために、各エッジのトポロジの不均衡を測定する新しいトポロジベースのメトリクスであるトポロジカル エントロピー (TE) を導入します。
私たちの実証研究は、TE がローカル クラス分布の分散を効果的に測定することを確認し、高い TE 値を持つエッジを優先することがトポロジの不均衡の問題に対処するのに役立つことを示しています。
これに基づいて、TE に基づく (合成) エッジのトレーニングに焦点を当てる、トポロジカル再重み付けと TE ウェッジベースのミックスアップという 2 つの戦略を開発します。
トポロジーの再重み付けは TE に従ってトレーニング エッジの重みを直接操作しますが、ウェッジベースのミックスアップでは、高 TE ウェッジ間の合成エッジを補間します。
最終的に、これらの戦略を、エッジ分類のための新しいトポロジ的不均衡戦略である TopoEdge に統合します。
広範な実験を通じて、新しく厳選されたデータセットに対する提案された戦略の有効性を実証し、(不均衡な) エッジ分類の新しいベンチマークを確立します。

要約(オリジナル)

Recent years have witnessed the remarkable success of applying Graph machine learning (GML) to node/graph classification and link prediction. However, edge classification task that enjoys numerous real-world applications such as social network analysis and cybersecurity, has not seen significant advancement. To address this gap, our study pioneers a comprehensive approach to edge classification. We identify a novel `Topological Imbalance Issue’, which arises from the skewed distribution of edges across different classes, affecting the local subgraph of each edge and harming the performance of edge classifications. Inspired by the recent studies in node classification that the performance discrepancy exists with varying local structural patterns, we aim to investigate if the performance discrepancy in topological imbalanced edge classification can also be mitigated by characterizing the local class distribution variance. To overcome this challenge, we introduce Topological Entropy (TE), a novel topological-based metric that measures the topological imbalance for each edge. Our empirical studies confirm that TE effectively measures local class distribution variance, and indicate that prioritizing edges with high TE values can help address the issue of topological imbalance. Based on this, we develop two strategies – Topological Reweighting and TE Wedge-based Mixup – to focus training on (synthetic) edges based on their TEs. While topological reweighting directly manipulates training edge weights according to TE, our wedge-based mixup interpolates synthetic edges between high TE wedges. Ultimately, we integrate these strategies into a novel topological imbalance strategy for edge classification: TopoEdge. Through extensive experiments, we demonstrate the efficacy of our proposed strategies on newly curated datasets and thus establish a new benchmark for (imbalanced) edge classification.

arxiv情報

著者 Xueqi Cheng,Yu Wang,Yunchao Liu,Yuying Zhao,Charu C. Aggarwal,Tyler Derr
発行日 2024-06-18 02:49:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SI パーマリンク