要約
本稿では、金融取引グラフにおける典型的なマネーロンダリングや不正行為のパターンをリアルタイムで検出するためのソフトウェア ライブラリである「グラフ フィーチャ プリプロセッサ」を紹介します。
これらのパターンは、ダウンストリームの機械学習トレーニングやマネーロンダリング検出などの推論タスク用の豊富なトランザクション機能セットを生成するために使用されます。
強化されたトランザクション機能により、勾配ブースティングベースの機械学習モデルの予測精度が劇的に向上することを示します。
私たちのライブラリはマルチコア並列処理を利用し、動的なメモリ内グラフを維持し、受信トランザクション ストリーム内のサブグラフ パターンを効率的にマイニングすることで、ストリーミング方式での操作を可能にします。
私たちは、非常に不均衡な合成マネーロンダリング対策 (AML) と実際のイーサリアム フィッシング データセットを使用してライブラリを評価します。
これらのデータセットでは、違法なトランザクションの割合が非常に小さいため、学習プロセスが困難になります。
グラフ特徴プリプロセッサと勾配ブースティングベースの機械学習モデルを組み合わせた当社のソリューションは、標準のグラフ ニューラル ネットワークよりも高い少数派クラスの F1 スコアでこれらの不正トランザクションを検出できます。
さらに、マルチコア CPU で実行されるソリューションのエンドツーエンドのスループット レートは、強力な V100 GPU で実行されるグラフ ニューラル ネットワークのベースラインを上回ります。
全体として、当社のソリューションの高精度、高スループット レート、低遅延の組み合わせは、現実世界のアプリケーションにおける当社のライブラリの実用的な価値を示しています。
グラフ機能プリプロセッサーは、IBM メインフレーム ソフトウェア製品、つまり「IBM Cloud Pak for Data on Z」および「AI Toolkit for IBM Z and LinuxONE」に統合されています。
要約(オリジナル)
In this paper, we present ‘Graph Feature Preprocessor’, a software library for detecting typical money laundering and fraud patterns in financial transaction graphs in real time. These patterns are used to produce a rich set of transaction features for downstream machine learning training and inference tasks such as money laundering detection. We show that our enriched transaction features dramatically improve the prediction accuracy of gradient-boosting-based machine learning models. Our library exploits multicore parallelism, maintains a dynamic in-memory graph, and efficiently mines subgraph patterns in the incoming transaction stream, which enables it to be operated in a streaming manner. We evaluate our library using highly-imbalanced synthetic anti-money laundering (AML) and real-life Ethereum phishing datasets. In these datasets, the proportion of illicit transactions is very small, which makes the learning process challenging. Our solution, which combines our Graph Feature Preprocessor and gradient-boosting-based machine learning models, is able to detect these illicit transactions with higher minority-class F1 scores than standard graph neural networks. In addition, the end-to-end throughput rate of our solution executed on a multicore CPU outperforms the graph neural network baselines executed on a powerful V100 GPU. Overall, the combination of high accuracy, a high throughput rate, and low latency of our solution demonstrates the practical value of our library in real-world applications. Graph Feature Preprocessor has been integrated into IBM mainframe software products, namely ‘IBM Cloud Pak for Data on Z’ and ‘AI Toolkit for IBM Z and LinuxONE’.
arxiv情報
著者 | Jovan Blanuša,Maximo Cravero Baraja,Andreea Anghel,Luc von Niederhäusern,Erik Altman,Haris Pozidis,Kubilay Atasu |
発行日 | 2024-02-13 16:53:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google