Beyond Individual Input for Deep Anomaly Detection on Tabular Data

要約

異常検出は、金融、医療、サイバーセキュリティなどの多くの分野で不可欠です。
この論文では、教師ありタスク用に最初に提案されたモデルであるノンパラメトリック変換器 (NPT) を利用して、特徴間依存性とサンプル間依存性の両方を捕捉する、表形式データに対する新しい深い異常検出方法を提案します。
再構築ベースのフレームワークでは、正常サンプルのマスクされた特徴を再構築するために NPT をトレーニングします。
ノンパラメトリックな方法で、推論中にトレーニング セット全体を活用し、マスクされた特徴を再構築するモデルの機能を使用して異常スコアを生成します。
私たちの知る限り、これは、表形式データセットの異常検出のために、特徴間依存関係とサンプル間依存関係をうまく組み合わせた最初の研究です。
31 のベンチマーク表形式データセットに対する広範な実験を通じて、私たちの手法が最先端のパフォーマンスを達成し、F1 スコアと AUROC の点で既存の手法をそれぞれ 1.7% と 1.2% 上回っていることを実証しました。
私たちのアブレーション研究は、表形式データの異常検出には両方のタイプの依存関係をモデル化することが重要であるという証拠を提供します。

要約(オリジナル)

Anomaly detection is vital in many domains, such as finance, healthcare, and cybersecurity. In this paper, we propose a novel deep anomaly detection method for tabular data that leverages Non-Parametric Transformers (NPTs), a model initially proposed for supervised tasks, to capture both feature-feature and sample-sample dependencies. In a reconstruction-based framework, we train the NPT to reconstruct masked features of normal samples. In a non-parametric fashion, we leverage the whole training set during inference and use the model’s ability to reconstruct the masked features to generate an anomaly score. To the best of our knowledge, this is the first work to successfully combine feature-feature and sample-sample dependencies for anomaly detection on tabular datasets. Through extensive experiments on 31 benchmark tabular datasets, we demonstrate that our method achieves state-of-the-art performance, outperforming existing methods by 1.7% and 1.2% in terms of F1-score and AUROC, respectively. Our ablation study provides evidence that modeling both types of dependencies is crucial for anomaly detection on tabular data.

arxiv情報

著者 Hugo Thimonier,Fabrice Popineau,Arpad Rimmel,Bich-Liên Doan
発行日 2023-09-25 16:10:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク