要約
オンラインでの金融サービスの利用が拡大し続けるにつれて、詐欺の発生率もそれに応じて急増しています。
詐欺師は、導入されている検出アルゴリズムを回避するための新しく革新的な方法を絶えず模索しています。
従来、不正行為の検出はルールベースの方法に依存しており、トランザクション データの特徴に基づいてルールが手動で作成されていました。
ただし、これらの手法は手動のルール作成に依存していることと、複雑なデータ パターンを検出できないため、すぐに効果がなくなりました。
現在、金融サービス部門の重要な部分では、XGBoost、ランダム フォレスト、ニューラル ネットワークなどのさまざまな機械学習アルゴリズムを使用して、トランザクション データをモデル化しています。
これらの手法は、ルールベースの手法よりも効率的であることが証明されていますが、依然として、異なるトランザクション間の相互作用やその相互関係を捕捉することはできません。
最近では、金融詐欺検出にグラフベースの技術が採用されており、グラフ トポロジを利用して、グラフ ニューラル ネットワーク (GNN) を使用して取引データの近傍情報を集約しています。
以前の手法に比べて改善が見られるにもかかわらず、これらの手法は依然として詐欺師の進化する偽装戦術に追いつくのに苦労しており、過度の平滑化による情報損失に悩まされています。
この論文では、カモフラージュ検出と非類似ノードからの重要な特徴情報の保存に効果的な、効率的な近傍サンプリング法を採用した新しいアルゴリズムを提案します。
さらに、アテンション メカニズムを利用し、情報損失を防ぐために全体的な近隣情報を保存する新しい GNN アーキテクチャを導入します。
私たちは財務データでアルゴリズムをテストし、私たちの方法が他の最先端のグラフ アルゴリズムよりも優れていることを示します。
要約(オリジナル)
As the availability of financial services online continues to grow, the incidence of fraud has surged correspondingly. Fraudsters continually seek new and innovative ways to circumvent the detection algorithms in place. Traditionally, fraud detection relied on rule-based methods, where rules were manually created based on transaction data features. However, these techniques soon became ineffective due to their reliance on manual rule creation and their inability to detect complex data patterns. Today, a significant portion of the financial services sector employs various machine learning algorithms, such as XGBoost, Random Forest, and neural networks, to model transaction data. While these techniques have proven more efficient than rule-based methods, they still fail to capture interactions between different transactions and their interrelationships. Recently, graph-based techniques have been adopted for financial fraud detection, leveraging graph topology to aggregate neighborhood information of transaction data using Graph Neural Networks (GNNs). Despite showing improvements over previous methods, these techniques still struggle to keep pace with the evolving camouflaging tactics of fraudsters and suffer from information loss due to over-smoothing. In this paper, we propose a novel algorithm that employs an efficient neighborhood sampling method, effective for camouflage detection and preserving crucial feature information from non-similar nodes. Additionally, we introduce a novel GNN architecture that utilizes attention mechanisms and preserves holistic neighborhood information to prevent information loss. We test our algorithm on financial data to show that our method outperforms other state-of-the-art graph algorithms.
arxiv情報
著者 | Prashank Kadam |
発行日 | 2024-11-22 18:34:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google