Leveraged Matrix Completion with Noise


サブサンプリングされた測定値から低ランク行列を完成させることは、過去 10 年間で大きな注目を集めてきました。
既存の研究は、ランク $r$ の $n \times n$ ノイズ行列の完全性を理論的に保証するには、いくつかの条件下で $\mathcal{O}(nr\log^2(n))$ データが必要であることを示しています。
かなり制限的な仮定: (1) 基礎となる行列は一貫性がなければなりません。
(2) 観測値は一様分布に従います。
この制限の一部は、レバレッジ スコアと各要素のオラクル情報の役割を無視していることによるものです。
このペーパーでは、てこ比スコアを使用して各要素の重要性を特徴付け、次の目的で仮定を大幅に緩和します。(1) 基礎となる低ランク行列に他の構造仮定が課されていない。
(2) 観察されている要素は、てこ比スコアを介してその重要性に適切に依存します。


Completing low-rank matrices from subsampled measurements has received much attention in the past decade. Existing works indicate that $\mathcal{O}(nr\log^2(n))$ datums are required to theoretically secure the completion of an $n \times n$ noisy matrix of rank $r$ with high probability, under some quite restrictive assumptions: (1) the underlying matrix must be incoherent; (2) observations follow the uniform distribution. The restrictiveness is partially due to ignoring the roles of the leverage score and the oracle information of each element. In this paper, we employ the leverage scores to characterize the importance of each element and significantly relax assumptions to: (1) not any other structure assumptions are imposed on the underlying low-rank matrix; (2) elements being observed are appropriately dependent on their importance via the leverage score. Under these assumptions, instead of uniform sampling, we devise an ununiform/biased sampling procedure that can reveal the “importance” of each observed element. Our proofs are supported by a novel approach that phrases sufficient optimality conditions based on the Golfing Scheme, which would be of independent interest to the wider areas. Theoretical findings show that we can provably recover an unknown $n\times n$ matrix of rank $r$ from just about $\mathcal{O}(nr\log^2 (n))$ entries, even when the observed entries are corrupted with a small amount of noisy information. The empirical results align precisely with our theories.


著者 Xinjian Huang,Weiwei Liu,Bo Du,Dacheng Tao
発行日 2023-08-14 10:15:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク