Bounded Simplex-Structured Matrix Factorization: Algorithms, Identifiability and Applications


タイトル:Bounded Simplex-Structured Matrix Factorization:アルゴリズム、識別可能性、および応用

– この論文では、入力行列Xと分解ランクrが与えられた場合、BSSMFと呼ばれる新しい低ランク行列分解モデルを提案する。
– BSSMFは、各列のエントリが与えられた区間に属しているという制約を持つ行列Wと、確率的単体層であるという制約を持つ行列Hを探します。
– BSSMFは、非負行列因子分解(NMF)および単体構造行列因子分解(SSMF)を一般化しています。
– BSSMFは、入力行列Xのエントリがある範囲に属している場合に特に適しています。
– BSSMFは、画像を表す行である場合や、NetflixおよびMovieLensデータセットのような評価行列である場合に有効です。
– BSSMFは、Xの列のソフトクラスタリングを提供する容易に理解できる分解を提供し、各列のWHのエントリがWの列と同じ範囲に属することを意味します。
– この論文では、まず、BSSMFの迅速なアルゴリズムを提案し、Xに欠落データがある場合でも補完できます。
– 次に、BSSMFの識別可能性条件を提供し、BSSMFが自明な曖昧さを除いてユニークな分解を持つ条件を示します。
– 最後に、2つの応用例である画像セット内の特徴抽出およびレコメンダーシステムのマトリックス補完問題でBSSMFの効果を示します。


In this paper, we propose a new low-rank matrix factorization model dubbed bounded simplex-structured matrix factorization (BSSMF). Given an input matrix $X$ and a factorization rank $r$, BSSMF looks for a matrix $W$ with $r$ columns and a matrix $H$ with $r$ rows such that $X \approx WH$ where the entries in each column of $W$ are bounded, that is, they belong to given intervals, and the columns of $H$ belong to the probability simplex, that is, $H$ is column stochastic. BSSMF generalizes nonnegative matrix factorization (NMF), and simplex-structured matrix factorization (SSMF). BSSMF is particularly well suited when the entries of the input matrix $X$ belong to a given interval; for example when the rows of $X$ represent images, or $X$ is a rating matrix such as in the Netflix and MovieLens datasets where the entries of $X$ belong to the interval $[1,5]$. The simplex-structured matrix $H$ not only leads to an easily understandable decomposition providing a soft clustering of the columns of $X$, but implies that the entries of each column of $WH$ belong to the same intervals as the columns of $W$. In this paper, we first propose a fast algorithm for BSSMF, even in the presence of missing data in $X$. Then we provide identifiability conditions for BSSMF, that is, we provide conditions under which BSSMF admits a unique decomposition, up to trivial ambiguities. Finally, we illustrate the effectiveness of BSSMF on two applications: extraction of features in a set of images, and the matrix completion problem for recommender systems.


著者 Olivier Vu Thanh,Nicolas Gillis,Fabian Lecron
発行日 2023-03-31 06:59:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.IR, cs.LG, cs.NA, eess.SP, math.NA, stat.ML パーマリンク