Robust Principal Component Analysis via Discriminant Sample Weight Learning

要約

主成分分析 (PCA) は古典的な特徴抽出方法ですが、外れ値によって悪影響を受ける可能性があり、射影行列の学習が不正確になる可能性があります。
この論文では、外れ値を含むデータから判別サンプルの重みを学習することにより、データ平均と PCA 射影行列の両方を推定する堅牢な方法を提案します。
データセット内の各サンプルには重みが割り当てられ、提案されたアルゴリズムはそれぞれ重み、平均、射影行列を繰り返し学習します。
具体的には、平均値と射影行列が利用可能な場合、外れ値のきめ細かい分析を通じて、各サンプルの重みが階層的に学習され、外れ値の重みが小さくなり、正常なサンプルの重みが大きくなります。
学習された重みが利用可能になると、重み付けされた最適化問題が解かれ、データ平均と射影行列の両方が推定されます。
学習された重みは正常サンプルから外れ値を区別するため、対応する小さな重みによって外れ値の悪影響が軽減されます。
おもちゃデータ、UCI データセット、および顔データセットに関する実験は、外れ値を含むデータから平均と射影行列を推定する際の提案された方法の有効性を実証します。

要約(オリジナル)

Principal component analysis (PCA) is a classical feature extraction method, but it may be adversely affected by outliers, resulting in inaccurate learning of the projection matrix. This paper proposes a robust method to estimate both the data mean and the PCA projection matrix by learning discriminant sample weights from data containing outliers. Each sample in the dataset is assigned a weight, and the proposed algorithm iteratively learns the weights, the mean, and the projection matrix, respectively. Specifically, when the mean and the projection matrix are available, via fine-grained analysis of outliers, a weight for each sample is learned hierarchically so that outliers have small weights while normal samples have large weights. With the learned weights available, a weighted optimization problem is solved to estimate both the data mean and the projection matrix. Because the learned weights discriminate outliers from normal samples, the adverse influence of outliers is mitigated due to the corresponding small weights. Experiments on toy data, UCI dataset, and face dataset demonstrate the effectiveness of the proposed method in estimating the mean and the projection matrix from the data containing outliers.

arxiv情報

著者 Yingzhuo Deng,Ke Hu,Bo Li,Yao Zhang
発行日 2024-08-22 13:06:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク