RIFF: Inducing Rules for Fraud Detection from Decision Trees

要約

金融詐欺は、毎年数十億ドルの損失の原因となっています。
従来、不正検出システムは、ルールの透明性と解釈可能性、つまり決定を説明する必要がある分野における重要な機能を理由に、ルールに依存していました。
ただし、ルール システムの作成と調整にはドメインの専門家からの多大な入力が必要ですが、ルール誘導アルゴリズムはデータからルールを直接推論することでこの問題を軽減しようとします。
私たちは、デシジョン ツリーから直接低 FPR ルール セットを抽出するルール誘導アルゴリズムである RIFF を提案することにより、ルール システムが低い誤検知率 (FPR) またはアラート率を持つように制約される不正検出へのこれらのアルゴリズムの適用を検討します。
私たちの実験によると、誘導されたルールは、多くの場合、低 FPR タスクの元のモデルのパフォーマンスを維持または向上させることができ、その一方で複雑さが大幅に軽減され、専門家が手動で調整したルールよりもパフォーマンスが優れていることがわかりました。

要約(オリジナル)

Financial fraud is the cause of multi-billion dollar losses annually. Traditionally, fraud detection systems rely on rules due to their transparency and interpretability, key features in domains where decisions need to be explained. However, rule systems require significant input from domain experts to create and tune, an issue that rule induction algorithms attempt to mitigate by inferring rules directly from data. We explore the application of these algorithms to fraud detection, where rule systems are constrained to have a low false positive rate (FPR) or alert rate, by proposing RIFF, a rule induction algorithm that distills a low FPR rule set directly from decision trees. Our experiments show that the induced rules are often able to maintain or improve performance of the original models for low FPR tasks, while substantially reducing their complexity and outperforming rules hand-tuned by experts.

arxiv情報

著者 João Lucas Martins,João Bravo,Ana Sofia Gomes,Carlos Soares,Pedro Bizarro
発行日 2024-08-23 11:14:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク