Independent Component Analysis by Robust Distance Correlation

要約

独立コンポーネント分析(ICA)は、無相関のソースだけでなく、完全に独立したソースに多変量信号または分布を分解するための強力なツールです。
残念ながら、ICAへのほとんどのアプローチは、外れ値に対して堅牢ではありません。
ここでは、RICAと呼ばれる堅牢なICAメソッドを提案します。これは、多変量ランダム変数間の依存性の堅牢な測定値を最小限に抑えることにより、コンポーネントを推定します。
使用される依存測定値は、距離相関(DCOR)です。
それをより堅牢にするために、最初にボウル変換と呼ばれる新しい変換を適用します。これは、境界があり、1対1、連続したマップで、原点に近いポイントにマップされます。
これにより、ゼロDCORが独立性を暗示する重要な特性が保存されます。
RICAは、残りのDCORが最小のコンポーネントを探すことにより、独立したソースを順番に推定します。
RICAは強く一貫しており、収束の通常のパラメトリックレートを持っています。
その堅牢性は、一般的に競合他社よりも優れているシミュレーション調査によって調査されます。
この方法は、有名なカクテルパーティーの問題を含む3つのアプリケーションに示されています。

要約(オリジナル)

Independent component analysis (ICA) is a powerful tool for decomposing a multivariate signal or distribution into fully independent sources, not just uncorrelated ones. Unfortunately, most approaches to ICA are not robust against outliers. Here we propose a robust ICA method called RICA, which estimates the components by minimizing a robust measure of dependence between multivariate random variables. The dependence measure used is the distance correlation (dCor). In order to make it more robust we first apply a new transformation called the bowl transform, which is bounded, one-to-one, continuous, and maps far outliers to points close to the origin. This preserves the crucial property that a zero dCor implies independence. RICA estimates the independent sources sequentially, by looking for the component that has the smallest dCor with the remainder. RICA is strongly consistent and has the usual parametric rate of convergence. Its robustness is investigated by a simulation study, in which it generally outperforms its competitors. The method is illustrated on three applications, including the well-known cocktail party problem.

arxiv情報

著者 Sarah Leyder,Jakob Raymaekers,Peter J. Rousseeuw,Tom Van Deuren,Tim Verdonck
発行日 2025-05-14 14:25:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.CO パーマリンク