Open-Set Graph Anomaly Detection via Normal Structure Regularisation

要約

この論文では、重要なグラフ異常検出 (GAD) タスク、つまりオープンセット GAD について検討します。このタスクは、考えられるすべての推論時間を説明することはできない少数のラベル付きトレーニング正常ノードと異常ノード (既知の異常として知られる) を使用して異常ノードを検出することを目的としています。
異常。
そのラベル付きデータを利用できると、GAD モデルの異常に関する重要な事前知識が得られ、検出エラーを大幅に減らすことができます。
ただし、現在の方法は、目に見える異常のフィッティングを過度に強調する傾向があり、目に見えない異常、つまり、ラベル付きの異常ノードによって示されていない異常を検出する一般化能力が弱くなります。
さらに、それらはユークリッド データを処理するために導入されたため、GAD にとって重要な非ユークリッド特徴を効果的に捕捉できませんでした。
この研究では、目に見える異常の検出における有効性を維持しながら、目に見えない異常に対する一般化された検出能力を達成するための、新しい開集合 GAD アプローチ、すなわち正常構造正則化 (NSReg) を提案します。
NSReg の重要なアイデアは、他のノードとの構造的関係に基づいて通常のノードのコンパクトで意味豊かな表現の学習を強制する正則化項を導入することです。
教師付き異常検出損失を使用して最適化すると、正則化項はモデリングに強力な正規性を組み込むのに役立ち、ノードの観察された異常と正常性の両方の共同学習を可能にするため、観察中に観察された異常のみをフィッティングすることに過度に重点を置くことが効果的に回避されます。
トレーニング。
6 つの現実世界のデータセットに関する広範な実証結果は、オープンセット GAD に対する私たちの提案した NSReg の優位性を示しています。

要約(オリジナル)

This paper considers an important Graph Anomaly Detection (GAD) task, namely open-set GAD, which aims to detect anomalous nodes using a small number of labelled training normal and anomaly nodes (known as seen anomalies) that cannot illustrate all possible inference-time abnormalities. The availability of that labelled data provides crucial prior knowledge about abnormalities for GAD models, enabling substantially reduced detection errors. However, current methods tend to over-emphasise fitting the seen anomalies, leading to a weak generalisation ability to detect unseen anomalies, i.e., those that are not illustrated by the labelled anomaly nodes. Further, they were introduced to handle Euclidean data, failing to effectively capture important non-Euclidean features for GAD. In this work, we propose a novel open-set GAD approach, namely Normal Structure Regularisation (NSReg), to achieve generalised detection ability to unseen anomalies, while maintaining its effectiveness on detecting seen anomalies. The key idea in NSReg is to introduce a regularisation term that enforces the learning of compact, semantically-rich representations of normal nodes based on their structural relations to other nodes. When being optimised with supervised anomaly detection losses, the regularisation term helps incorporate strong normality into the modelling, empowering the joint learning of both seen abnormality and normality of the nodes, and thus, it effectively avoids the over emphasis on solely fitting the seen anomalies during training. Extensive empirical results on six real-world datasets demonstrate the superiority of our proposed NSReg for open-set GAD.

arxiv情報

著者 Qizhou Wang,Guansong Pang,Mahsa Salehi,Christopher Leckie
発行日 2024-02-19 15:12:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.SI パーマリンク