Optimizing Feature Selection for Binary Classification with Noisy Labels: A Genetic Algorithm Approach

要約

ノイズの多いラベル シナリオでの特徴選択は、依然として研究が進んでいないトピックです。
我々は、ノイズを含むラベルを使用したバイナリ分類で最適な特徴サブセットを選択するための、新しい遺伝的アルゴリズム ベースのアプローチであるノイズ認識多目的特徴選択遺伝的アルゴリズム (NMFS-GA) を提案します。
NMFS-GA は、正確かつ解釈可能な機能サブセットを選択するための統合フレームワークを提供します。
ラベル ノイズを含む合成データセット、ノイズの多い特徴が豊富に含まれる乳がんデータセット、認知症移行予測のための実世界の ADNI データセットで NMFS-GA を評価します。
私たちの結果は、NMFS-GA がノイズの多いラベルを含むシナリオでバイナリ分類器の精度と解釈可能性を向上させる特徴サブセットを効果的に選択できることを示しています。

要約(オリジナル)

Feature selection in noisy label scenarios remains an understudied topic. We propose a novel genetic algorithm-based approach, the Noise-Aware Multi-Objective Feature Selection Genetic Algorithm (NMFS-GA), for selecting optimal feature subsets in binary classification with noisy labels. NMFS-GA offers a unified framework for selecting feature subsets that are both accurate and interpretable. We evaluate NMFS-GA on synthetic datasets with label noise, a Breast Cancer dataset enriched with noisy features, and a real-world ADNI dataset for dementia conversion prediction. Our results indicate that NMFS-GA can effectively select feature subsets that improve the accuracy and interpretability of binary classifiers in scenarios with noisy labels.

arxiv情報

著者 Vandad Imani,Elaheh Moradi,Carlos Sevilla-Salcedo,Vittorio Fortino,Jussi Tohka
発行日 2024-01-12 12:42:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.NE パーマリンク