要約
特定のターゲット変数と関連性の高い複雑なシステムの特徴を知ることは、科学の多くの分野で基本的な関心事である。既存のアプローチは、しばしば線形設定に限定され、時には保証を欠き、ほとんどの場合、手元の問題、特に画像に対してスケールしない。我々は、非線形かつ高次元設定においても原因特徴を同定するための、二重に頑健な特徴選択法であるDRCFSを提案する。理論的な保証を提供し、我々の仮定に対する必要条件を説明し、幅広い模擬データセットと半合成データセットで広範な実験を行う。DRCFSは既存の最先端手法を大幅に凌駕し、非線形かつ高次元の困難な問題においても頑健な特徴を選択する。
要約(オリジナル)
Knowing the features of a complex system that are highly relevant to a particular target variable is of fundamental interest in many areas of science. Existing approaches are often limited to linear settings, sometimes lack guarantees, and in most cases, do not scale to the problem at hand, in particular to images. We propose DRCFS, a doubly robust feature selection method for identifying the causal features even in nonlinear and high dimensional settings. We provide theoretical guarantees, illustrate necessary conditions for our assumptions, and perform extensive experiments across a wide range of simulated and semi-synthetic datasets. DRCFS significantly outperforms existing state-of-the-art methods, selecting robust features even in challenging highly non-linear and high-dimensional problems.
arxiv情報
著者 | Francesco Quinzan,Ashkan Soleymani,Patrik Jaillet,Cristian R. Rojas,Stefan Bauer |
発行日 | 2023-07-03 09:03:22+00:00 |
arxivサイト | arxiv_id(pdf) |