要約
企業詐欺検出は、不正な財務諸表や違法なインサイダー取引などの不法な活動を実施する企業を自動的に認識することを目的としています。
以前の学習ベースの方法は、会社ネットワークでリッチな相互作用を効果的に統合することができません。
このギャップを埋めるために、中国で18年間の財務記録を収集して、詐欺ラベルを備えた3つのグラフデータセットを形成します。
財務グラフの特性を分析し、2つの顕著な問題を強調します。(1)情報の過負荷:企業ノードに対する(騒々しい)非企業ノードの優位性は、グラフ畳み込みネットワーク(GCN)のメッセージパスプロセスを妨げます。
(2)隠された詐欺:収集されたデータに、検出されない違反の大部分が存在します。
隠された詐欺の問題は、トレーニングデータセットにノイズの多いラベルを導入し、詐欺検出の結果を妥協します。
このような課題を処理するために、堅牢な2段階学習($ {\ rm kegcn} _ {r} $)を備えた知識強化GCN、すなわち、知識グラフの埋め込みを活用して情報の過負荷を軽減し、豊富な表現を効果的に学習するという新しいグラフベースの方法、すなわち、知識が強化されたGCNを提案します。
提案されたモデルは、隠された詐欺に対する堅牢性を高めるために2段階の学習方法を採用しています。
広範な実験結果は、相互作用の重要性を確認するだけでなく、詐欺検出の有効性と堅牢性の観点から、多くの強力なベースラインにわたって$ {\ rm kegcn} _ {r} $の優位性を示しています。
要約(オリジナル)
Corporate fraud detection aims to automatically recognize companies that conduct wrongful activities such as fraudulent financial statements or illegal insider trading. Previous learning-based methods fail to effectively integrate rich interactions in the company network. To close this gap, we collect 18-year financial records in China to form three graph datasets with fraud labels. We analyze the characteristics of the financial graphs, highlighting two pronounced issues: (1) information overload: the dominance of (noisy) non-company nodes over company nodes hinders the message-passing process in Graph Convolution Networks (GCN); and (2) hidden fraud: there exists a large percentage of possible undetected violations in the collected data. The hidden fraud problem will introduce noisy labels in the training dataset and compromise fraud detection results. To handle such challenges, we propose a novel graph-based method, namely, Knowledge-enhanced GCN with Robust Two-stage Learning (${\rm KeGCN}_{R}$), which leverages Knowledge Graph Embeddings to mitigate the information overload and effectively learns rich representations. The proposed model adopts a two-stage learning method to enhance robustness against hidden frauds. Extensive experimental results not only confirm the importance of interactions but also show the superiority of ${\rm KeGCN}_{R}$ over a number of strong baselines in terms of fraud detection effectiveness and robustness.
arxiv情報
著者 | Shiqi Wang,Zhibo Zhang,Libing Fang,Cam-Tu Nguyen,Wenzhon Li |
発行日 | 2025-02-26 17:05:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google