Leveraged Matrix Completion with Noise

要約

サブサンプリングされた測定値から低ランク行列を完成させることは、過去 10 年間で大きな注目を集めてきました。
既存の研究は、ランク $r$ の $n \times n$ ノイズ行列の完全性を理論的に保証するには、いくつかの条件下で $\mathcal{O}(nr\log^2(n))$ データが必要であることを示しています。
かなり制限的な仮定: (1) 基礎となる行列は一貫性がなければなりません。
(2) 観測値は一様分布に従います。
この制限の一部は、レバレッジ スコアと各要素のオラクル情報の役割を無視していることによるものです。
このペーパーでは、てこ比スコアを使用して各要素の重要性を特徴付け、次の目的で仮定を大幅に緩和します。(1) 基礎となる低ランク行列に他の構造仮定が課されていない。
(2) 観察されている要素は、てこ比スコアを介してその重要性に適切に依存します。
これらの仮定の下で、均一なサンプリングの代わりに、観察された各要素の「重要性」を明らかにできる不均一/偏ったサンプリング手順を考案します。
私たちの証明は、ゴルフスキームに基づいて十分な最適性条件を表現する新しいアプローチによってサポートされており、これはより広範な分野にとって独立した関心事となるでしょう。
理論的発見は、たとえ観測されたエントリが
少量のノイズの多い情報により破損しています。
経験的な結果は私たちの理論と正確に一致しています。

要約(オリジナル)

Completing low-rank matrices from subsampled measurements has received much attention in the past decade. Existing works indicate that $\mathcal{O}(nr\log^2(n))$ datums are required to theoretically secure the completion of an $n \times n$ noisy matrix of rank $r$ with high probability, under some quite restrictive assumptions: (1) the underlying matrix must be incoherent; (2) observations follow the uniform distribution. The restrictiveness is partially due to ignoring the roles of the leverage score and the oracle information of each element. In this paper, we employ the leverage scores to characterize the importance of each element and significantly relax assumptions to: (1) not any other structure assumptions are imposed on the underlying low-rank matrix; (2) elements being observed are appropriately dependent on their importance via the leverage score. Under these assumptions, instead of uniform sampling, we devise an ununiform/biased sampling procedure that can reveal the “importance” of each observed element. Our proofs are supported by a novel approach that phrases sufficient optimality conditions based on the Golfing Scheme, which would be of independent interest to the wider areas. Theoretical findings show that we can provably recover an unknown $n\times n$ matrix of rank $r$ from just about $\mathcal{O}(nr\log^2 (n))$ entries, even when the observed entries are corrupted with a small amount of noisy information. The empirical results align precisely with our theories.

arxiv情報

著者 Xinjian Huang,Weiwei Liu,Bo Du,Dacheng Tao
発行日 2023-08-14 10:15:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク