要約
独立成分分析(ICA)は、観測データから独立した潜在的なソースを線形に離散化するためのブラインドソース分離法である。我々は、観測データが異なるビューに分割され、それぞれが共有ソースと個別ソースの混合物を受信するノイズ線形ICAの特別な設定について調べる。我々は、対応する線形構造が識別可能であることを証明し、音源の分布を回復することができる。計算上、音源を推定するために、全てのビューにおける観測データの結合対数尤度の制約付き形式を最適化する。また、測定値がノイズに汚染されている場合にも、我々の目的が音源を回復することを経験的に示す。さらに、共有音源の数を回復するためのモデル選択手順を提案し、実証的に検証する。最後に、2つの異なる研究所(2つの異なる見解)から提供された2つの大規模トランスクリプトームデータセット(観測データ)から推定された共有ソースを用いて、基礎となるグラフ構造のもっともらしい表現を見つけるために利用される(共有)ソースを回復する、困難な実生活でのアプリケーションに提案モデルを適用します。
要約(オリジナル)
Independent component analysis (ICA) is a blind source separation method for linear disentanglement of independent latent sources from observed data. We investigate the special setting of noisy linear ICA where the observations are split among different views, each receiving a mixture of shared and individual sources. We prove that the corresponding linear structure is identifiable, and the source distribution can be recovered. To computationally estimate the sources, we optimize a constrained form of the joint log-likelihood of the observed data among all views. We also show empirically that our objective recovers the sources also in the case when the measurements are corrupted by noise. Furthermore, we propose a model selection procedure for recovering the number of shared sources which we verify empirically. Finally, we apply the proposed model in a challenging real-life application, where the estimated shared sources from two large transcriptome datasets (observed data) provided by two different labs (two different views) lead to recovering (shared) sources utilized for finding a plausible representation of the underlying graph structure.
arxiv情報
著者 | Teodora Pandeva,Patrick Forré |
発行日 | 2023-03-03 15:58:47+00:00 |
arxivサイト | arxiv_id(pdf) |