要約
テューキーの深さ (または半空間深さ) は、多変量データの中心性の尺度として広く使用されています。
ただし、テューキーの深さの正確な計算は、高次元では難しい問題であることが知られています。
改善策として、Tukey の深さのランダム化された近似が提案されています。
この論文では、そのようなランダム化されたアルゴリズムがいつ Tukey の深さの適切な近似値を返すかを調査します。
データが対数凹等方性分布からサンプリングされた場合を研究します。
次元内でアルゴリズムを多項式時間で実行する必要がある場合、ランダム化されたアルゴリズムは最大の深さ $1/2$ とゼロに近い深さを正確に近似することを証明します。
一方、中間の深さの点の場合、適切な近似には指数関数的な複雑さが必要です。
要約(オリジナル)
Tukey’s depth (or halfspace depth) is a widely used measure of centrality for multivariate data. However, exact computation of Tukey’s depth is known to be a hard problem in high dimensions. As a remedy, randomized approximations of Tukey’s depth have been proposed. In this paper we explore when such randomized algorithms return a good approximation of Tukey’s depth. We study the case when the data are sampled from a log-concave isotropic distribution. We prove that, if one requires that the algorithm runs in polynomial time in the dimension, the randomized algorithm correctly approximates the maximal depth $1/2$ and depths close to zero. On the other hand, for any point of intermediate depth, any good approximation requires exponential complexity.
arxiv情報
著者 | Simon Briend,Gábor Lugosi,Roberto Imbuzeiro Oliveira |
発行日 | 2023-10-20 13:18:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google