Nearly Linear Sparsification of $\ell_p$ Subspace Approximation

要約

ell_p$部分空間近似問題は、中央超平面問題($p = 1$)、主成分分析($p = 2$)、中央超平面問題($p = \infty$)を一般化したNP困難な低ランク近似問題である。この問題のNP困難性に対処するための一般的なアプローチは、強いコアセットを計算することである。強いコアセットとは、入力点の小さな重み付き部分集合であり、同時に全ての$k$次元部分空間のコストを、典型的には小さな定数$varepsilon$に対して$(1+varepsilon)$の相対誤差で近似する。 我々は、$p<2$で$tilde O(k)↪Mathrm{poly}(↪Mathrm{poly})$, $p>2$で$tilde O(k^{p/2})↪Mathrm{poly}(↪Mathrm{poly})$ のほぼ線形な束縛を得る、ランクパラメータ$k$にほぼ最適な依存性を持つ$ell_p$部分空間近似のための強いコアセット構築のための最初のアルゴリズムを得る。先行する構成は、同様のサイズ境界を達成したが、元の点を修正したコアセットを生成した[SW18, FKW21]か、元の点のコアセットを生成したが、コアセットのサイズに$mathrm{poly}(k)$因子を失った[HV20, WY23]。 また、我々の手法は、オフライン設定と同様の境界を持つ、$mathmathrm{poly}(k)$部分空間近似のための最初のほぼ最適なオンライン強いコアセットにつながり、[WY23]の問題を解決する。先行する全てのアプローチは、この設定において、元の点を修正することを許されても、$mathrm{poly}(k)$因子を失う。

要約(オリジナル)

The $\ell_p$ subspace approximation problem is an NP-hard low rank approximation problem that generalizes the median hyperplane problem ($p = 1$), principal component analysis ($p = 2$), and the center hyperplane problem ($p = \infty$). A popular approach to cope with the NP-hardness of this problem is to compute a strong coreset, which is a small weighted subset of the input points which simultaneously approximates the cost of every $k$-dimensional subspace, typically to $(1+\varepsilon)$ relative error for a small constant $\varepsilon$. We obtain the first algorithm for constructing a strong coreset for $\ell_p$ subspace approximation with a nearly optimal dependence on the rank parameter $k$, obtaining a nearly linear bound of $\tilde O(k)\mathrm{poly}(\varepsilon^{-1})$ for $p<2$ and $\tilde O(k^{p/2})\mathrm{poly}(\varepsilon^{-1})$ for $p>2$. Prior constructions either achieved a similar size bound but produced a coreset with a modification of the original points [SW18, FKW21], or produced a coreset of the original points but lost $\mathrm{poly}(k)$ factors in the coreset size [HV20, WY23]. Our techniques also lead to the first nearly optimal online strong coresets for $\ell_p$ subspace approximation with similar bounds as the offline setting, resolving a problem of [WY23]. All prior approaches lose $\mathrm{poly}(k)$ factors in this setting, even when allowed to modify the original points.

arxiv情報

著者 David P. Woodruff,Taisuke Yasuda
発行日 2024-07-03 16:49:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.DS, cs.LG パーマリンク