Applied Machine Learning to Anomaly Detection in Enterprise Purchase Processes

要約

プロセスが継続的にデジタル化される中、組織は、データ量の増加に伴って不審なアクティビティを明らかにする可能性がある異常を検出するという課題に対処する必要があります。
この目標を追求するために、定期的に監査が実施され、内部監査人や購買専門家はこれらのプロセスを自動化する新しい方法を常に模索しています。
この研究では、実際のデータからの 2 つの大規模な購入データセットで検出されたケースの調査に優先順位を付ける方法論を提案しています。
目標は、企業の管理努力の有効性に貢献し、そのようなタスクの実行パフォーマンスを向上させることです。
異常を検出するために教師なし機械学習技術を使用する前に、包括的な探索的データ分析が実行されます。
単変量アプローチは z-Score インデックスと DBSCAN アルゴリズムを通じて適用され、多変量分析は k-Means アルゴリズムと Isolation Forest アルゴリズム、および Silhouette インデックスを使用して実装され、その結果、各メソッドにトランザクション候補の提案が含まれます。
審査。
候補者のアンサンブル優先順位付けは、企業の専門家の理解を助ける説明可能性手法 (LIME、Shapley、SHAP) の提案と併せて提供されます。

要約(オリジナル)

In a context of a continuous digitalisation of processes, organisations must deal with the challenge of detecting anomalies that can reveal suspicious activities upon an increasing volume of data. To pursue this goal, audit engagements are carried out regularly, and internal auditors and purchase specialists are constantly looking for new methods to automate these processes. This work proposes a methodology to prioritise the investigation of the cases detected in two large purchase datasets from real data. The goal is to contribute to the effectiveness of the companies’ control efforts and to increase the performance of carrying out such tasks. A comprehensive Exploratory Data Analysis is carried out before using unsupervised Machine Learning techniques addressed to detect anomalies. A univariate approach has been applied through the z-Score index and the DBSCAN algorithm, while a multivariate analysis is implemented with the k-Means and Isolation Forest algorithms, and the Silhouette index, resulting in each method having a transaction candidates’ proposal to be reviewed. An ensemble prioritisation of the candidates is provided jointly with a proposal of explicability methods (LIME, Shapley, SHAP) to help the company specialists in their understanding.

arxiv情報

著者 A. Herreros-Martínez,R. Magdalena-Benedicto,J. Vila-Francés,A. J. Serrano-López,S. Pérez-Díaz
発行日 2024-05-23 16:21:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.LG パーマリンク