Graph Anomaly Detection with Noisy Labels by Reinforcement Learning

要約

グラフ異常検出 (GAD) は、金融における不正検出やソーシャル ネットワークのロボット アカウントなど、多くの分野で広く適用されています。
既存の方法は、通常のノードから逸脱した外れ値ノードを識別することに特化しています。
これらは現実世界のシナリオでは入手が難しい高品質のアノテーションに大きく依存していますが、ノイズの多いラベルに基づいてパフォーマンスが大幅に低下する可能性があります。
したがって、ノイズの影響を軽減するために、疑わしいノードのエッジをカットするように動機づけられます。
ただし、ノイズの多いラベルを持つノードを正確に識別することは依然として困難です。
さらに、縁を切った後悔はプラスにもマイナスにも影響するため、定量的に評価することは困難です。
この目的のために、我々は新しいフレームワークREGAD、すなわちREinforced Graph Anomaly Detectorを提案します。
具体的には、ノードを介して近似されたノイズの多いエッジを信頼性の高いラベルでカットすることで、ベース検出器のパフォーマンス向上 (AUC) を最大化することを目指しています。
(i) 調整されたアクションと検索スペースを設計して、ポリシー ネットワークをトレーニングしてエッジを段階的に慎重に剪定します。各ステップでは、少数の疑わしいエッジのみが優先されます。
(ii) ベース検出器からのフィードバックに基づいてポリシーを繰り返し最適化するためのポリシーインザループ メカニズムを設計します。
全体的なパフォーマンスは累積報酬によって評価されます。
異なる異常率の下で 3 つのデータセットに対して広範な実験が行われます。
結果は、私たちが提案したREGADの優れたパフォーマンスを示しています。

要約(オリジナル)

Graph anomaly detection (GAD) has been widely applied in many areas, e.g., fraud detection in finance and robot accounts in social networks. Existing methods are dedicated to identifying the outlier nodes that deviate from normal ones. While they heavily rely on high-quality annotation, which is hard to obtain in real-world scenarios, this could lead to severely degraded performance based on noisy labels. Thus, we are motivated to cut the edges of suspicious nodes to alleviate the impact of noise. However, it remains difficult to precisely identify the nodes with noisy labels. Moreover, it is hard to quantitatively evaluate the regret of cutting the edges, which may have either positive or negative influences. To this end, we propose a novel framework REGAD, i.e., REinforced Graph Anomaly Detector. Specifically, we aim to maximize the performance improvement (AUC) of a base detector by cutting noisy edges approximated through the nodes with high-confidence labels. (i) We design a tailored action and search space to train a policy network to carefully prune edges step by step, where only a few suspicious edges are prioritized in each step. (ii) We design a policy-in-the-loop mechanism to iteratively optimize the policy based on the feedback from base detector. The overall performance is evaluated by the cumulative rewards. Extensive experiments are conducted on three datasets under different anomaly ratios. The results indicate the superior performance of our proposed REGAD.

arxiv情報

著者 Zhu Wang,Shuang Zhou,Junnan Dong,Chang Yang,Xiao Huang,Shengjie Zhao
発行日 2024-07-08 13:41:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク