Smoothed Separable Nonnegative Matrix Factorization


– 線形代数、信号処理、データ解析、機械学習において、ある頂点の凸包に属するデータ点のセットが与えられた場合、ノイズが存在する中でこれらの頂点を推定することは、重要な問題です。
– それぞれの頂点に少なくとも1つの近くのデータ点があるという仮定の下で多くのアルゴリズムが開発されています。中でも、頂点成分分析(VCA)と、逐次射影アルゴリズム(SPA)が最も広く使われています。この仮定は、盲目的な高次元分光画像の無混合(blind hyperspectral unmixing)でのpure-pixel仮定、非負行列分解での分離可能仮定として知られています。
– 近くの複数のデータポイントが各頂点に存在するという仮定に基づく潜在的なシンプレックス(ALLS)を学習するアルゴリズムとして、BhattacharyyaとKannanが2020年に提案しました。この場合、ALLSは分離可能性の仮定に基づくアルゴリズムよりも、ノイズに対して確率的により強力です。
– 本論文では、ALLSに着想を得て、頂点に近くの複数のデータポイントが存在すると仮定して、VCAとSPAを一般化するスムージングされたVCA(SVCA)とスムージングされたSPA(SSPA)を提案します。
– 弊社は、SVCAとSSPAが、合成データセット、高次元分光画像の無混合、顔の画像データセットの特徴抽出でVCA、SPA、ALLSよりも効果的であることを示しています。加えて、VCAの新しい理論的結果を示しています。


Given a set of data points belonging to the convex hull of a set of vertices, a key problem in linear algebra, signal processing, data analysis and machine learning is to estimate these vertices in the presence of noise. Many algorithms have been developed under the assumption that there is at least one nearby data point to each vertex; two of the most widely used ones are vertex component analysis (VCA) and the successive projection algorithm (SPA). This assumption is known as the pure-pixel assumption in blind hyperspectral unmixing, and as the separability assumption in nonnegative matrix factorization. More recently, Bhattacharyya and Kannan (ACM-SIAM Symposium on Discrete Algorithms, 2020) proposed an algorithm for learning a latent simplex (ALLS) that relies on the assumption that there is more than one nearby data point to each vertex. In that scenario, ALLS is probalistically more robust to noise than algorithms based on the separability assumption. In this paper, inspired by ALLS, we propose smoothed VCA (SVCA) and smoothed SPA (SSPA) that generalize VCA and SPA by assuming the presence of several nearby data points to each vertex. We illustrate the effectiveness of SVCA and SSPA over VCA, SPA and ALLS on synthetic data sets, on the unmixing of hyperspectral images, and on feature extraction on facial images data sets. In addition, our study highlights new theoretical results for VCA.


著者 Nicolas Nadisic,Nicolas Gillis,Christophe Kervazo
発行日 2023-04-21 09:00:03+00:00
カテゴリー: cs.LG, eess.IV, eess.SP, stat.ML パーマリンク