GADBench: Revisiting and Benchmarking Supervised Graph Anomaly Detection

要約

従来のグラフ異常検出 (GAD) アルゴリズムと最近人気のグラフ ニューラル ネットワーク (GNN) には長い歴史がありますが、(1) 標準的な包括的な設定の下でそれらがどのように動作するか、(2) GNN が次のような従来のアルゴリズムを上回ることができるかどうかはまだ明らかではありません。
(3) 大規模なグラフでの効率はどうか。
これに応えて、静的グラフにおける監視付き異常ノード検出専用のベンチマーク ツールである GADBench を導入します。
GADBench は、数千から数百万 ($\sim$6M) のノードを含む 10 の実世界の GAD データセット上の 29 の異なるモデルにわたる詳細な比較を容易にします。
私たちの主な発見は、単純な近傍集約を備えたツリー アンサンブルが、GAD タスクに合わせて調整された最新の GNN よりも優れたパフォーマンスを発揮できるということです。
私たちは GAD の現在の進歩に光を当て、この領域におけるその後の調査のための強固な基礎を築きました。
GADBench は、https://github.com/squareRoot3/GADBench でオープンソース化されています。

要約(オリジナル)

With a long history of traditional Graph Anomaly Detection (GAD) algorithms and recently popular Graph Neural Networks (GNNs), it is still not clear (1) how they perform under a standard comprehensive setting, (2) whether GNNs can outperform traditional algorithms such as tree ensembles, and (3) how about their efficiency on large-scale graphs. In response, we introduce GADBench — a benchmark tool dedicated to supervised anomalous node detection in static graphs. GADBench facilitates a detailed comparison across 29 distinct models on ten real-world GAD datasets, encompassing thousands to millions ($\sim$6M) nodes. Our main finding is that tree ensembles with simple neighborhood aggregation can outperform the latest GNNs tailored for the GAD task. We shed light on the current progress of GAD, setting a robust groundwork for subsequent investigations in this domain. GADBench is open-sourced at https://github.com/squareRoot3/GADBench.

arxiv情報

著者 Jianheng Tang,Fengrui Hua,Ziqi Gao,Peilin Zhao,Jia Li
発行日 2023-11-16 14:05:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク