Boundary Peeling: Outlier Detection Method Using One-Class Peeling

要約

教師なし外れ値の検出はデータ分析における重要な段階を構成し、依然として動的な研究領域です。
優れた外れ値検出アルゴリズムは、計算効率が高く、パラメーター選択の調整に対して堅牢であり、基礎となる多様なデータ分布にわたって一貫して良好に実行できる必要があります。
教師なし外れ値検出アルゴリズムである One-Class Boundary Peeling を紹介します。
1 クラス境界ピーリングは、1 クラス サポート ベクター マシンによって生成された、反復的にピーリングされた柔軟な境界からの平均符号付き距離を使用します。
1 クラスの境界ピーリングには堅牢なハイパーパラメータ設定があり、柔軟性を高めるためにアンサンブル メソッドとしてキャストできます。
合成データ シミュレーションでは、ワンクラス境界ピーリングは、外れ値が存在しない場合はすべての最先端の方法よりも優れたパフォーマンスを発揮しますが、外れ値が存在する場合でもベンチマーク手法と比較して同等または優れたパフォーマンスを維持します。
One-Class Boundary Peeling は、共通のベンチマーク データ セットを使用して、正確な分類、AUC、および処理時間の点で優れた性能を発揮します。

要約(オリジナル)

Unsupervised outlier detection constitutes a crucial phase within data analysis and remains a dynamic realm of research. A good outlier detection algorithm should be computationally efficient, robust to tuning parameter selection, and perform consistently well across diverse underlying data distributions. We introduce One-Class Boundary Peeling, an unsupervised outlier detection algorithm. One-class Boundary Peeling uses the average signed distance from iteratively-peeled, flexible boundaries generated by one-class support vector machines. One-class Boundary Peeling has robust hyperparameter settings and, for increased flexibility, can be cast as an ensemble method. In synthetic data simulations One-Class Boundary Peeling outperforms all state of the art methods when no outliers are present while maintaining comparable or superior performance in the presence of outliers, as compared to benchmark methods. One-Class Boundary Peeling performs competitively in terms of correct classification, AUC, and processing time using common benchmark data sets.

arxiv情報

著者 Sheikh Arafat,Na Sun,Maria L. Weese,Waldyn G. Martinez
発行日 2023-09-11 17:19:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク