Truncated Affinity Maximization: One-class Homophily Modeling for Graph Anomaly Detection

要約

これは、実世界のグラフ異常検出 (GAD) データセットで経験的に見つかった一般的な特性の 1 つです。つまり、正常なノードは相互に強い接続/親和性を持つ傾向があるのに対し、異常なノードの相同性は強い傾向があります。
通常のノードよりも大幅に弱いです。
ただし、この異常識別特性は、データ再構成などの従来の異常検出目的を使用して通常構築される既存の GAD 手法では無視されます。
この研究では、この特性を調査して、GAD の新しい教師なし異常スコア測定であるローカル ノード アフィニティを導入します。これは、ノードの属性/表現の類似性として定義されるアフィニティを使用して、隣接ノードとの関連性が低いノードにより大きな異常スコアを割り当てます。

さらに、近隣ノードに対するローカル アフィニティを最大化することで、異常測定のために調整されたノード表現を学習する Truncated Affinity Maximization (TAM) を提案します。
元のグラフ構造での最適化は、非相同エッジ (つまり、正常なノードと異常なノードを接続するエッジ) によって偏る可能性があります。
したがって、TAM は代わりに、このバイアスを軽減するために非相同性のエッジが反復的に削除される切り捨てられたグラフ上で最適化されます。
学習された表現により、異常なノードよりも正常なノードに対するローカル アフィニティが大幅に強くなります。
10 の実世界の GAD データセットに関する広範な実証結果は、TAM が 7 つの競合モデルを大幅に上回り、困難なデータセットでの最良の競合モデルと比較して AUROC/AUPRC で 10% 以上の増加を達成したことを示しています。
私たちのコードは https://github.com/mala-lab/TAM-master/ で入手できます。

要約(オリジナル)

We reveal a one-class homophily phenomenon, which is one prevalent property we find empirically in real-world graph anomaly detection (GAD) datasets, i.e., normal nodes tend to have strong connection/affinity with each other, while the homophily in abnormal nodes is significantly weaker than normal nodes. However, this anomaly-discriminative property is ignored by existing GAD methods that are typically built using a conventional anomaly detection objective, such as data reconstruction. In this work, we explore this property to introduce a novel unsupervised anomaly scoring measure for GAD, local node affinity, that assigns a larger anomaly score to nodes that are less affiliated with their neighbors, with the affinity defined as similarity on node attributes/representations. We further propose Truncated Affinity Maximization (TAM) that learns tailored node representations for our anomaly measure by maximizing the local affinity of nodes to their neighbors. Optimizing on the original graph structure can be biased by nonhomophily edges (i.e., edges connecting normal and abnormal nodes). Thus, TAM is instead optimized on truncated graphs where non-homophily edges are removed iteratively to mitigate this bias. The learned representations result in significantly stronger local affinity for normal nodes than abnormal nodes. Extensive empirical results on 10 real-world GAD datasets show that TAM substantially outperforms seven competing models, achieving over 10% increase in AUROC/AUPRC compared to the best contenders on challenging datasets. Our code is available at https://github.com/mala-lab/TAM-master/.

arxiv情報

著者 Hezhe Qiao,Guansong Pang
発行日 2023-12-08 08:47:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.SI パーマリンク