2SFGL: A Simple And Robust Protocol For Graph-Based Fraud Detection

要約

グラフ学習を使用した金融犯罪検出により、金融の安全性と効率が向上します。
ただし、犯罪者は検出を避けるためにさまざまな機関にまたがって金融犯罪を犯す可能性があり、グラフ学習にローカル データを使用する金融機関にとっては検出の難易度が高くなります。
ほとんどの金融機関はデータプライバシー保護に関して厳しい規制を受けているため、トレーニングデータは分離されることが多く、従来の学習テクノロジーでは問題に対処できません。
フェデレーテッド ラーニング (FL) を使用すると、複数の機関がデータセットを相互に公開することなくモデルをトレーニングできるため、データ プライバシーの保護が確実になります。
この論文では、連合グラフ学習 (2SFGL) に対する新しい 2 段階のアプローチを提案します。2SFGL の最初の段階では、マルチパーティ グラフの仮想融合が含まれ、2 番目の段階では、仮想グラフでのモデルのトレーニングと推論が含まれます。
FraudAmazonDataset と FraudYelpDataset に基づいた従来の不正検出タスクでフレームワークを評価します。
実験結果は、GCN (グラフ畳み込みネットワーク) を 2SFGL フレームワークと統合して同じタスクに適用すると、GraphSAGE を統合しながら、FedAvg のみを使用した場合と比較して、いくつかの一般的なメトリクスでパフォーマンスが 17.6\%-30.2\% 向上することを示しています。
2SFGL を使用すると、FedAvg のみを使用した場合と比較して、パフォーマンスが 6\%-16.2\% 向上します。
私たちが提案するフレームワークは、既存のグラフベースの不正検出方法に簡単に統合できる堅牢かつシンプルなプロトコルであると結論付けています。

要約(オリジナル)

Financial crime detection using graph learning improves financial safety and efficiency. However, criminals may commit financial crimes across different institutions to avoid detection, which increases the difficulty of detection for financial institutions which use local data for graph learning. As most financial institutions are subject to strict regulations in regards to data privacy protection, the training data is often isolated and conventional learning technology cannot handle the problem. Federated learning (FL) allows multiple institutions to train a model without revealing their datasets to each other, hence ensuring data privacy protection. In this paper, we proposes a novel two-stage approach to federated graph learning (2SFGL): The first stage of 2SFGL involves the virtual fusion of multiparty graphs, and the second involves model training and inference on the virtual graph. We evaluate our framework on a conventional fraud detection task based on the FraudAmazonDataset and FraudYelpDataset. Experimental results show that integrating and applying a GCN (Graph Convolutional Network) with our 2SFGL framework to the same task results in a 17.6\%-30.2\% increase in performance on several typical metrics compared to the case only using FedAvg, while integrating GraphSAGE with 2SFGL results in a 6\%-16.2\% increase in performance compared to the case only using FedAvg. We conclude that our proposed framework is a robust and simple protocol which can be simply integrated to pre-existing graph-based fraud detection methods.

arxiv情報

著者 Zhirui Pan,Guangzhong Wang,Zhaoning Li,Lifeng Chen,Yang Bian,Zhongyuan Lai
発行日 2023-10-12 13:48:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR パーマリンク