要約
特徴の重要度の値の解釈は、多くの場合、値自体ではなく、特徴の相対的な順序 (ランキングと呼ばれます) に依存します。
ただし、重要度の値の計算に使用されるサンプル サイズが小さいため、順序が不安定になる可能性があります。
私たちは、ポストホック重要度法によりランキングとそのランキングに対する同時信頼区間を生成することを提案します。
特徴重要度値のペアごとの比較に基づいて、私たちの方法では、「真の」(無限のサンプル) ランキングが高確率で含まれることが保証され、上位 k 個のセットを選択できます。
要約(オリジナル)
Interpretation of feature importance values often relies on the relative order of the features rather than on the value itself, referred to as ranking. However, the order may be unstable due to the small sample sizes used in calculating the importance values. We propose that post-hoc importance methods produce a ranking and simultaneous confident intervals for the rankings. Based on pairwise comparisons of the feature importance values, our method is guaranteed to include the “true” (infinite sample) ranking with high probability and allows for selecting top-k sets.
arxiv情報
著者 | Bitya Neuhof,Yuval Benjamini |
発行日 | 2023-07-28 07:23:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google