要約
機能の選択は、高次元のデータセットで関連する機能を特定し、「次元の呪い」を軽減し、機械学習パフォーマンスを向上させるために重要です。
分類のための従来の機能選択方法すべてのクラスのデータを使用して、各クラスの機能を選択します。
このホワイトペーパーでは、低ランクの生成方法に基づいてクラスモデルを使用し、信号対雑音比(SNR)機能選択基準を導入するクラスモデルを個別に選択する機能選択方法について説明します。
この新しいアプローチには、特定の仮定の下で理論的な真の機能回復保証があり、標準分類データセットの既存の機能選択方法を上回ることが示されています。
要約(オリジナル)
Feature selection is crucial for pinpointing relevant features in high-dimensional datasets, mitigating the ‘curse of dimensionality,’ and enhancing machine learning performance. Traditional feature selection methods for classification use data from all classes to select features for each class. This paper explores feature selection methods that select features for each class separately, using class models based on low-rank generative methods and introducing a signal-to-noise ratio (SNR) feature selection criterion. This novel approach has theoretical true feature recovery guarantees under certain assumptions and is shown to outperform some existing feature selection methods on standard classification datasets.
arxiv情報
著者 | Rittwika Kansabanik,Adrian Barbu |
発行日 | 2025-04-07 17:23:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google