教師なし外れ値検出アルゴリズムである One-Class Boundary Peeling を紹介します。
1 クラス境界ピーリングは、1 クラス サポート ベクター マシンによって生成された、反復的にピーリングされた柔軟な境界からの平均符号付き距離を使用します。
1 クラスの境界ピーリングには堅牢なハイパーパラメータ設定があり、柔軟性を高めるためにアンサンブル メソッドとしてキャストできます。
合成データ シミュレーションでは、ワンクラス境界ピーリングは、外れ値が存在しない場合はすべての最先端の方法よりも優れたパフォーマンスを発揮しますが、外れ値が存在する場合でもベンチマーク手法と比較して同等または優れたパフォーマンスを維持します。
One-Class Boundary Peeling は、共通のベンチマーク データ セットを使用して、正確な分類、AUC、および処理時間の点で優れた性能を発揮します。
Unsupervised outlier detection constitutes a crucial phase within data analysis and remains a dynamic realm of research. A good outlier detection algorithm should be computationally efficient, robust to tuning parameter selection, and perform consistently well across diverse underlying data distributions. We introduce One-Class Boundary Peeling, an unsupervised outlier detection algorithm. One-class Boundary Peeling uses the average signed distance from iteratively-peeled, flexible boundaries generated by one-class support vector machines. One-class Boundary Peeling has robust hyperparameter settings and, for increased flexibility, can be cast as an ensemble method. In synthetic data simulations One-Class Boundary Peeling outperforms all state of the art methods when no outliers are present while maintaining comparable or superior performance in the presence of outliers, as compared to benchmark methods. One-Class Boundary Peeling performs competitively in terms of correct classification, AUC, and processing time using common benchmark data sets.
著者 | Sheikh Arafat,Na Sun,Maria L. Weese,Waldyn G. Martinez |
発行日 | 2023-09-11 17:19:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google