BOLIMES: Boruta and LIME optiMized fEature Selection for Gene Expression Classification

要約

遺伝子発現の分類は、主にゲノムデータの高次元と過剰適合のリスクのために、バイオインフォマティクスにおける極めて重要でありながら挑戦的な作業です。
このギャップを埋めるために、機能サブセットを体系的に改良することにより、遺伝子発現分類を強化するように設計された新しい特徴選択アルゴリズムであるBolimesを提案します。
統計的ランキングまたは分類器固有の選択のみに依存する従来の方法とは異なり、ボルタの堅牢性と石灰の解釈可能性を統合し、最も関連性が高く影響力のある遺伝子のみが保持されるようにします。
Bolimesは、最初にBorutaを使用して、各機能をランダム化された対応物と比較することにより、非情報遺伝子を除外し、貴重な情報を保存します。
次に、石灰を使用して、分類器に対する局所的な重要性に基づいて残りの遺伝子をランク付けします。
最後に、反復分類評価により、予測精度を最大化する遺伝子の数を選択することにより、最適な特徴サブセットが決定されます。
徹底的な特徴選択と解釈可能性駆動型の改良性を組み合わせることにより、私たちのソリューションは、寸法削減と高い分類性能のバランスを効果的にバランスさせ、高次元遺伝子発現解析のための強力なソリューションを提供します。

要約(オリジナル)

Gene expression classification is a pivotal yet challenging task in bioinformatics, primarily due to the high dimensionality of genomic data and the risk of overfitting. To bridge this gap, we propose BOLIMES, a novel feature selection algorithm designed to enhance gene expression classification by systematically refining the feature subset. Unlike conventional methods that rely solely on statistical ranking or classifier-specific selection, we integrate the robustness of Boruta with the interpretability of LIME, ensuring that only the most relevant and influential genes are retained. BOLIMES first employs Boruta to filter out non-informative genes by comparing each feature against its randomized counterpart, thus preserving valuable information. It then uses LIME to rank the remaining genes based on their local importance to the classifier. Finally, an iterative classification evaluation determines the optimal feature subset by selecting the number of genes that maximizes predictive accuracy. By combining exhaustive feature selection with interpretability-driven refinement, our solution effectively balances dimensionality reduction with high classification performance, offering a powerful solution for high-dimensional gene expression analysis.

arxiv情報

著者 Bich-Chung Phan,Thanh Ma,Huu-Hoa Nguyen,and Thanh-Nghi Do
発行日 2025-02-18 17:33:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク