要約
グラフ異常検出 (GAD) は、グラフ内の異常なノードを特定し、ネットワーク セキュリティ、不正検出、ソーシャル メディア スパム検出、およびその他のさまざまな領域でのアプリケーションを見つけるために使用される技術です。
GAD の一般的な方法はグラフ オート エンコーダ (GAE) です。これは、グラフ データをノード表現にエンコードし、これらの表現に基づいてグラフの再構成品質を評価することで異常を特定します。
ただし、既存の GAE モデルは主に直接リンク再構築用に最適化されており、その結果、グラフ内で接続されたノードが潜在空間内でクラスター化されます。
その結果、クラスタータイプの構造異常の検出には優れていますが、クラスターに適合しないより複雑な構造異常には苦労します。
この制限に対処するために、我々は、グラフ異常検出のための近傍再構築を組み込んだ GAE の新しい変形である、GAD-NR と呼ばれる新しいソリューションを提案します。
GAD-NR は、対応するノード表現に基づいて、ローカル構造、自己属性、および近隣属性を含むノードの近隣全体を再構築することを目的としています。
異常なノードと正常なノード間の近傍再構成損失を比較することにより、GAD-NR は異常を効果的に検出できます。
6 つの現実世界のデータセットに対して行われた広範な実験により、GAD-NR の有効性が検証され、最先端の競合他社と比べて大幅な改善 (AUC が最大 30% 向上) が示されました。
GAD-NR のソース コードは公開されています。
重要なのは、比較分析により、既存の方法が、調査された 3 種類の異常のうち 1 種類または 2 種類の異常の検出においてのみうまく機能することが明らかになったということです。
対照的に、GAD-NR は、データセット全体にわたる 3 種類の異常すべての検出に優れており、その包括的な異常検出機能を実証しています。
要約(オリジナル)
Graph Anomaly Detection (GAD) is a technique used to identify abnormal nodes within graphs, finding applications in network security, fraud detection, social media spam detection, and various other domains. A common method for GAD is Graph Auto-Encoders (GAEs), which encode graph data into node representations and identify anomalies by assessing the reconstruction quality of the graphs based on these representations. However, existing GAE models are primarily optimized for direct link reconstruction, resulting in nodes connected in the graph being clustered in the latent space. As a result, they excel at detecting cluster-type structural anomalies but struggle with more complex structural anomalies that do not conform to clusters. To address this limitation, we propose a novel solution called GAD-NR, a new variant of GAE that incorporates neighborhood reconstruction for graph anomaly detection. GAD-NR aims to reconstruct the entire neighborhood of a node, encompassing the local structure, self-attributes, and neighbor attributes, based on the corresponding node representation. By comparing the neighborhood reconstruction loss between anomalous nodes and normal nodes, GAD-NR can effectively detect any anomalies. Extensive experimentation conducted on six real-world datasets validates the effectiveness of GAD-NR, showcasing significant improvements (by up to 30% in AUC) over state-of-the-art competitors. The source code for GAD-NR is openly available. Importantly, the comparative analysis reveals that the existing methods perform well only in detecting one or two types of anomalies out of the three types studied. In contrast, GAD-NR excels at detecting all three types of anomalies across the datasets, demonstrating its comprehensive anomaly detection capabilities.
arxiv情報
著者 | Amit Roy,Juan Shu,Jia Li,Carl Yang,Olivier Elshocht,Jeroen Smeets,Pan Li |
発行日 | 2023-06-07 16:12:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google