DGraph: A Large-Scale Financial Dataset for Graph Anomaly Detection

要約

グラフ異常検出 (GAD) は、その実用性と理論的価値により、最近注目の研究スポットとなっています。
GAD は異常サンプルの用途と希少性を重視しているため、データセットの種類を充実させることが基本的な作業です。
したがって、このホワイトペーパーでは、金融ドメインにおける現実世界の動的グラフである DGraph を紹介します。
DGraph は、現在の GAD データセットの多くの制限を克服します。
これには、約 300 万のノード、400 万のダイナミック エッジ、100 万のグラウンド トゥルース ノードが含まれています。
我々は DGraph の包括的な観察を提供し、異常なノードと正常なノードが一般に異なる構造、隣接分布、および時間的ダイナミクスを持っていることを明らかにします。
さらに、ラベルのないノードも詐欺師を検出するために不可欠であることを示唆しています。
さらに、DGraph では広範な実験を行っています。
観察と実験により、DGraph が GAD 研究を推進し、異常なノードの詳細な探索を可能にすることが実証されました。

要約(オリジナル)

Graph Anomaly Detection (GAD) has recently become a hot research spot due to its practicability and theoretical value. Since GAD emphasizes the application and the rarity of anomalous samples, enriching the varieties of its datasets is fundamental work. Thus, this paper present DGraph, a real-world dynamic graph in the finance domain. DGraph overcomes many limitations of current GAD datasets. It contains about 3M nodes, 4M dynamic edges, and 1M ground-truth nodes. We provide a comprehensive observation of DGraph, revealing that anomalous nodes and normal nodes generally have different structures, neighbor distribution, and temporal dynamics. Moreover, it suggests that unlabeled nodes are also essential for detecting fraudsters. Furthermore, we conduct extensive experiments on DGraph. Observation and experiments demonstrate that DGraph is propulsive to advance GAD research and enable in-depth exploration of anomalous nodes.

arxiv情報

著者 Xuanwen Huang,Yang Yang,Yang Wang,Chunping Wang,Zhisheng Zhang,Jiarong Xu,Lei Chen,Michalis Vazirgiannis
発行日 2023-06-09 11:37:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SI パーマリンク