要約
機械学習モデルはさまざまな分野で広く応用されています。
利害関係者は、モデルの予測に対する入力特徴の寄与をより深く理解するために、事後特徴重要度手法を使用することがよくあります。
これらの方法によって提供される重要度の値の解釈は、多くの場合、重要度の値自体ではなく、特徴の相対的な順序 (ランク付け) に基づいています。
順序が不安定である可能性があるため、グローバル重要度値の不確実性を定量化するためのフレームワークを提示します。
特徴重要度値のフレームワークとペアワイズ比較に基づく、特徴重要度値の事後解釈のための新しい方法を提案します。
この方法では、高い確率で「真の」(無限のサンプル) ランクを含む特徴のランクに対する信頼区間が同時に生成され、上位 k 個の重要な特徴のセットの選択が可能になります。
要約(オリジナル)
Machine learning models are widely applied in various fields. Stakeholders often use post-hoc feature importance methods to better understand the input features’ contribution to the models’ predictions. The interpretation of the importance values provided by these methods is frequently based on the relative order of the features (their ranking) rather than the importance values themselves. Since the order may be unstable, we present a framework for quantifying the uncertainty in global importance values. We propose a novel method for the post-hoc interpretation of feature importance values that is based on the framework and pairwise comparisons of the feature importance values. This method produces simultaneous confidence intervals for the features’ ranks, which include the “true” (infinite sample) ranks with high probability, and enables the selection of the set of the top-k important features.
arxiv情報
著者 | Bitya Neuhof,Yuval Benjamini |
発行日 | 2024-04-18 11:44:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google