Truncated Affinity Maximization: One-class Homophily Modeling for Graph Anomaly Detection


実世界のグラフ異常検知(GAD)データセットにおいて経験的に見出される一つの一般的な特性は、1クラス同相性、すなわち、正常なノードは互いに強い接続/親和性を持つ傾向があり、異常ノードにおける同相性は正常ノードより著しく弱い。しかし、この異常判別特性は、一般的にデータ再構成などの従来の異常検出の目的を用いて構築される既存のGAD手法では無視されている。本研究では、この性質を利用して、GADのための新しい教師なし異常スコアリング指標であるローカルノードアフィニティを導入し、ノードの属性や表現に関する親和性を定義した上で、近隣との親和性が低いノードに大きな異常スコアを割り当てることを提案する。さらに、ノードの局所的な親和性を最大化することで、異常指標に合わせたノード表現を学習するTruncated Affinity Maximization (TAM)を提案する。元のグラフ構造で最適化すると、非同族エッジ(すなわち、正常ノードと異常ノードを結ぶエッジ)により偏りが生じる可能性がある。そこで、TAMは、このバイアスを軽減するために、非同族エッジを繰り返し除去する切り捨てグラフで最適化する。学習された表現は、異常なノードよりも正常なノードに対する局所的な親和性を著しく強くする結果となった。実世界の6つのGADデータセットを用いた広範な実証実験により、TAMは競合する7つのモデルを大幅に上回り、困難なデータセットにおいて最良の競合モデルと比較してAUROC/AUPRCで10%以上の増加を達成することが示されました。我々のコードは https: // で公開される予定です。


One prevalent property we find empirically in real-world graph anomaly detection (GAD) datasets is a one-class homophily, i.e., normal nodes tend to have strong connection/affinity with each other, while the homophily in abnormal nodes is significantly weaker than normal nodes. However, this anomaly-discriminative property is ignored by existing GAD methods that are typically built using a conventional anomaly detection objective, such as data reconstruction. In this work, we explore this property to introduce a novel unsupervised anomaly scoring measure for GAD — local node affinity — that assigns a larger anomaly score to nodes that are less affiliated with their neighbors, with the affinity defined as similarity on node attributes/representations. We further propose Truncated Affinity Maximization (TAM) that learns tailored node representations for our anomaly measure by maximizing the local affinity of nodes to their neighbors. Optimizing on the original graph structure can be biased by non-homophily edges (i.e., edges connecting normal and abnormal nodes). Thus, TAM is instead optimized on truncated graphs where non-homophily edges are removed iteratively to mitigate this bias. The learned representations result in significantly stronger local affinity for normal nodes than abnormal nodes. Extensive empirical results on six real-world GAD datasets show that TAM substantially outperforms seven competing models, achieving over 10% increase in AUROC/AUPRC compared to the best contenders on challenging datasets. Our code will be made available at https: //


著者 Hezhe Qiao,Guansong Pang
発行日 2023-06-02 12:07:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.AI, cs.LG, cs.SI パーマリンク