On the quality of randomized approximations of Tukey’s depth

要約

テューキーの深さ (または半空間深さ) は、多変量データの中心性の尺度として広く使用されています。
ただし、テューキーの深さの正確な計算は、高次元では難しい問題であることが知られています。
改善策として、Tukey の深さのランダム化された近似が提案されています。
この論文では、そのようなランダム化されたアルゴリズムがいつ Tukey の深さの適切な近似値を返すかを調査します。
データが対数凹等方性分布からサンプリングされた場合を研究します。
次元内でアルゴリズムを多項式時間で実行する必要がある場合、ランダム化されたアルゴリズムは最大の深さ $1/2$ とゼロに近い深さを正確に近似することを証明します。
一方、中間の深さの点の場合、適切な近似には指数関数的な複雑さが必要です。

要約(オリジナル)

Tukey’s depth (or halfspace depth) is a widely used measure of centrality for multivariate data. However, exact computation of Tukey’s depth is known to be a hard problem in high dimensions. As a remedy, randomized approximations of Tukey’s depth have been proposed. In this paper we explore when such randomized algorithms return a good approximation of Tukey’s depth. We study the case when the data are sampled from a log-concave isotropic distribution. We prove that, if one requires that the algorithm runs in polynomial time in the dimension, the randomized algorithm correctly approximates the maximal depth $1/2$ and depths close to zero. On the other hand, for any point of intermediate depth, any good approximation requires exponential complexity.

arxiv情報

著者 Simon Briend,Gábor Lugosi,Roberto Imbuzeiro Oliveira
発行日 2023-09-11 17:52:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.PR, stat.ML パーマリンク