Alleviating Structural Distribution Shift in Graph Anomaly Detection

要約

グラフ異常検出 (GAD) は、異常ノードと正常ノード間の構造分布が異なるため、難しい二項分類問題です。異常ノードは少数派であるため、正常ノードと比較して異種性が高く、同性性が低くなります。
さらに、さまざまな時間要因や人間の専門家の注釈の好みにより、異種性と同性性はトレーニング データとテスト データ間で変化する可能性があり、これを本稿では構造分布シフト (SDS) と呼びます。
主流の手法はグラフ ニューラル ネットワーク (GNN) に基づいて構築されており、同種近傍を集約することで正常の分類に利益をもたらしますが、異常に対する SDS 問題が無視され、一般化が不十分であるという問題があります。
この作業では、機能の観点から問題を解決します。
SDS の程度が異常ノードと正常ノード間で異なることが観察されます。
したがって、この問題に対処するには、異常に対する高度な異性愛に抵抗し、同時に同性愛から正常を学習することが鍵となります。
私たちは、異好性の隣人の影響を緩和し、それらを不変にするために制約する異常な特徴を取り出します。
私たちは、提案するフレームワークをグラフ分解ネットワーク (GDN) と名付けます。
2 つのベンチマーク データセットに対して広範な実験が行われ、提案されたフレームワークは、特にトレーニング環境とテスト環境間で異常の構造分布が大きく異なる SDS 環境において、GAD のパフォーマンスの大幅な向上を達成しました。
コードは https://github.com/blacksingular/wsdm_GDN でオープンソース化されています。

要約(オリジナル)

Graph anomaly detection (GAD) is a challenging binary classification problem due to its different structural distribution between anomalies and normal nodes — abnormal nodes are a minority, therefore holding high heterophily and low homophily compared to normal nodes. Furthermore, due to various time factors and the annotation preferences of human experts, the heterophily and homophily can change across training and testing data, which is called structural distribution shift (SDS) in this paper. The mainstream methods are built on graph neural networks (GNNs), benefiting the classification of normals from aggregating homophilous neighbors, yet ignoring the SDS issue for anomalies and suffering from poor generalization. This work solves the problem from a feature view. We observe that the degree of SDS varies between anomalies and normal nodes. Hence to address the issue, the key lies in resisting high heterophily for anomalies meanwhile benefiting the learning of normals from homophily. We tease out the anomaly features on which we constrain to mitigate the effect of heterophilous neighbors and make them invariant. We term our proposed framework as Graph Decomposition Network (GDN). Extensive experiments are conducted on two benchmark datasets, and the proposed framework achieves a remarkable performance boost in GAD, especially in an SDS environment where anomalies have largely different structural distribution across training and testing environments. Codes are open-sourced in https://github.com/blacksingular/wsdm_GDN.

arxiv情報

著者 Yuan Gao,Xiang Wang,Xiangnan He,Zhenguang Liu,Huamin Feng,Yongdong Zhang
発行日 2024-01-25 13:07:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク