Causality-Based Feature Importance Quantifying Methods:PN-FI, PS-FI and PNS-FI

要約

現在の ML フィールドでは、モデルが大規模かつ複雑になり、使用するデータも量が多くなり、次元も高くなっています。そのため、より良いモデルをトレーニングし、トレーニング時間と計算リソースを節約するには、優れた特徴選択 (FS) 方法が必要です。
前処理段階が必要です。
特徴重要度 (FI) は特徴選択の基礎となるため、非常に重要です。
この論文は、特徴の重要性を定量化するために因果関係における PNS (必要性と十分性の確率) の計算を創造的に導入し、新しい FI 測定方法を作成します。PN-FI は、画像認識タスクにおいて特徴がどれだけ重要かを意味し、PS_FI は、どのように重要かを意味します。
画像生成タスクにおける特徴の重要性と、その両方を測定する PNS_FI です。
この論文の本体は 3 つの RCT であり、その結果により、犬の鼻、犬の目、犬の口という 3 つの特徴の PS_FI、PN_FI、PNS_FI がどのように計算されるかを示します。
FI 値は、厳密な上限と下限を持つ間隔です。

要約(オリジナル)

In current ML field models are getting larger and more complex, data we use are also getting larger in quantity and higher in dimension, so in order to train better models, save training time and computational resources, a good Feature Selection (FS) method in preprocessing stage is necessary. Feature importance (FI) is of great importance since it is the basis of feature selection. This paper creatively introduces the calculation of PNS(the probability of Necessity and Sufficiency) in Causality into quantifying feature importance and creates new FI measuring methods: PN-FI, which means how much importance a feature has in image recognition tasks, PS_FI that means how much importance a feature has in image generating tasks, and PNS_FI which measures both. The main body of this paper is three RCTs, with whose results we show how PS_FI, PN_FI and PNS_FI of three features: dog nose, dog eyes and dog mouth are calculated. The FI values are intervals with tight upper and lower bounds.

arxiv情報

著者 Shuxian Du,Yaxiu Sun,Changyi Du
発行日 2023-08-28 10:24:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク