Graph-Based Automatic Feature Selection for Multi-Class Classification via Mean Simplified Silhouette

要約

この論文では、マルチクラス分類タスクのための自動特徴選択 (GB-AFS と略称) のための新しいグラフベースのフィルター手法を紹介します。
この方法は、異なるクラス間の補完的な識別能力を維持しながら、予測パフォーマンスを維持するために必要な特徴の最小の組み合わせを決定します。
選択する機能の数などのユーザー定義のパラメーターは必要ありません。
この方法論では、Jeffries-Matusita (JM) 距離と t 分布確率的近傍埋め込み (t-SNE) を併用して、各特徴がクラスの各ペアをどれだけ効果的に区別できるかを反映する低次元空間を生成します。
最小数の特徴は、特徴選択タスクのクラスタリング結果を評価するために設計された、新しく開発された Mean Simplified Silhouette (略称 MSS) インデックスを使用して選択されます。
公開データセットでの実験結果は、提案された GB-AFS が他のフィルターベースの技術や自動特徴選択アプローチよりも優れたパフォーマンスを示していることを示しています。
さらに、提案されたアルゴリズムは、$7\%$ ~ $30\%$ の機能のみを使用しながら、すべての機能を利用したときに達成される精度を維持しました。
その結果、分類に必要な時間が $15\%$ から $70\%$ に短縮されました。

要約(オリジナル)

This paper introduces a novel graph-based filter method for automatic feature selection (abbreviated as GB-AFS) for multi-class classification tasks. The method determines the minimum combination of features required to sustain prediction performance while maintaining complementary discriminating abilities between different classes. It does not require any user-defined parameters such as the number of features to select. The methodology employs the Jeffries-Matusita (JM) distance in conjunction with t-distributed Stochastic Neighbor Embedding (t-SNE) to generate a low-dimensional space reflecting how effectively each feature can differentiate between each pair of classes. The minimum number of features is selected using our newly developed Mean Simplified Silhouette (abbreviated as MSS) index, designed to evaluate the clustering results for the feature selection task. Experimental results on public data sets demonstrate the superior performance of the proposed GB-AFS over other filter-based techniques and automatic feature selection approaches. Moreover, the proposed algorithm maintained the accuracy achieved when utilizing all features, while using only $7\%$ to $30\%$ of the features. Consequently, this resulted in a reduction of the time needed for classifications, from $15\%$ to $70\%$.

arxiv情報

著者 David Levin,Gonen Singer
発行日 2023-09-05 14:37:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク