要約
この研究では、実際のオンライン クレジット カード支払いデータを使用した不正検出に焦点を当て、不均衡な学習タスクにおける異常検出 (AD) 手法の応用を検討しています。
いくつかの最近の AD 手法のパフォーマンスを評価し、その有効性を標準的な教師あり学習手法と比較します。
データセット内の分布の変化の証拠を提供して、テストされたモデルのパフォーマンスに対するその影響を分析します。
私たちの調査結果では、LightGBM は評価されたすべてのメトリックにわたって大幅に優れたパフォーマンスを示しますが、AD 手法よりも分布の変化による影響が大きいことが明らかになりました。
さらに、私たちの調査により、LightGBM は AD 手法によって検出された不正行為の大部分も捕捉していることが明らかになりました。
この観察は、教師ありアプローチと AD アプローチを組み合わせてパフォーマンスを向上させるアンサンブル手法の潜在的な利点に疑問を投げかけます。
要約すると、この研究は、現実世界のシナリオにおけるこれらの技術の有用性についての実用的な洞察を提供し、不正検出における LightGBM の優位性を示すとともに、分布の変化に関連する課題を強調しています。
要約(オリジナル)
This study explores the application of anomaly detection (AD) methods in imbalanced learning tasks, focusing on fraud detection using real online credit card payment data. We assess the performance of several recent AD methods and compare their effectiveness against standard supervised learning methods. Offering evidence of distribution shift within our dataset, we analyze its impact on the tested models’ performances. Our findings reveal that LightGBM exhibits significantly superior performance across all evaluated metrics but suffers more from distribution shifts than AD methods. Furthermore, our investigation reveals that LightGBM also captures the majority of frauds detected by AD methods. This observation challenges the potential benefits of ensemble methods to combine supervised, and AD approaches to enhance performance. In summary, this research provides practical insights into the utility of these techniques in real-world scenarios, showing LightGBM’s superiority in fraud detection while highlighting challenges related to distribution shifts.
arxiv情報
著者 | Hugo Thimonier,Fabrice Popineau,Arpad Rimmel,Bich-Liên Doan,Fabrice Daniel |
発行日 | 2023-12-21 14:42:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google