GADBench: Revisiting and Benchmarking Supervised Graph Anomaly Detection

要約

従来のグラフ異常検出 (GAD) アルゴリズムと最近普及したグラフ ニューラル ネットワーク (GNN) には長い歴史がありますが、(1) 標準的な包括的な設定の下でそれらがどのように動作するか、(2) GNN が次のような従来のアルゴリズムを上回るかどうかはまだ明らかではありません。
ツリー アンサンブル、および (3) 大規模なグラフでの効率。
これに応えて、静的グラフ上の監視付き異常ノード検出のための包括的なベンチマークである GADBench を紹介します。
GADBench は、数千から数百万のノード ($\sim$6M) にわたる 10 の実世界の GAD データセット上の 23 の異なるモデルにわたる徹底的な比較を提供します。
私たちの主な発見は、単純な近傍集約を使用したツリー アンサンブルが、GAD タスク用に調整された最新の GNN を含む他のすべてのベースラインよりも優れているということです。
GADBench をオープンソース ツールとして利用できるようにすることで、GAD の現在の進歩に関する重要な洞察を提供し、将来の研究のための強固な基盤を確立します。
私たちのコードは https://github.com/squareRoot3/GADBench で入手できます。

要約(オリジナル)

With a long history of traditional Graph Anomaly Detection (GAD) algorithms and recently popular Graph Neural Networks (GNNs), it is still not clear (1) how they perform under a standard comprehensive setting, (2) whether GNNs outperform traditional algorithms such as tree ensembles, and (3) their efficiency on large-scale graphs. In response, we present GADBench — a comprehensive benchmark for supervised anomalous node detection on static graphs. GADBench provides a thorough comparison across 23 distinct models on ten real-world GAD datasets ranging from thousands to millions of nodes ($\sim$6M). Our main finding is that tree ensembles with simple neighborhood aggregation outperform all other baselines, including the latest GNNs tailored for the GAD task. By making GADBench available as an open-source tool, we offer pivotal insights into the current advancements of GAD and establish a solid foundation for future research. Our code is available at https://github.com/squareRoot3/GADBench.

arxiv情報

著者 Jianheng Tang,Fengrui Hua,Ziqi Gao,Peilin Zhao,Jia Li
発行日 2023-06-21 13:16:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク