Fast kernel half-space depth for data with non-convex supports

要約

データ深度は、順序と分位数を多変量設定以上に一般化する統計関数であり、記述的および視覚的な統計、異常検出、テストなどにまたがるアプリケーションが使用されます。有名なハーフスペース深度は、不変性の特性を提供する最適化プログラムを介してデータ ジオメトリを利用します。
、堅牢性、ノンパラメトリック性。
それにもかかわらず、凸データのサポートを暗黙的に前提としており、指数関数的な計算コストが必要になります。
配信のマルチモダリティに取り組むために、再現カーネル ヒルベルト スペース (RKHS) のハーフスペースの深さを拡張します。
得られた深さが直観的であることを示し、均一性テストを可能にする証明可能な濃度限界との一貫性を確立します。
提案された深さは、マニホールド勾配を使用して計算でき、半空間の深さよりも数桁速くなります。
私たちの深さのパフォーマンスは、数値シミュレーションだけでなく、実際のデータの異常検出や均一性テストなどのアプリケーションを通じて実証されます。

要約(オリジナル)

Data depth is a statistical function that generalizes order and quantiles to the multivariate setting and beyond, with applications spanning over descriptive and visual statistics, anomaly detection, testing, etc. The celebrated halfspace depth exploits data geometry via an optimization program to deliver properties of invariances, robustness, and non-parametricity. Nevertheless, it implicitly assumes convex data supports and requires exponential computational cost. To tackle distribution’s multimodality, we extend the halfspace depth in a Reproducing Kernel Hilbert Space (RKHS). We show that the obtained depth is intuitive and establish its consistency with provable concentration bounds that allow for homogeneity testing. The proposed depth can be computed using manifold gradient making faster than halfspace depth by several orders of magnitude. The performance of our depth is demonstrated through numerical simulations as well as applications such as anomaly detection on real data and homogeneity testing.

arxiv情報

著者 Arturo Castellanos,Pavlo Mozharovskyi,Florence d’Alché-Buc,Hicham Janati
発行日 2023-12-21 18:55:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク