Less is More: Fewer Interpretable Region via Submodular Subset Selection

要約

画像アトリビューション アルゴリズムは、モデルの決定に関連性の高い重要な領域を特定することを目的としています。
既存のアトリビューション ソリューションはターゲット要素に効果的に重要性を割り当てることができますが、依然として次の課題に直面しています。1) 既存のアトリビューション メソッドは不正確な小さな領域を生成するため、正しいアトリビューションの方向を誤解させる、2) モデルは間違ったサンプルに対して良好なアトリビューション結果を生成できない
予測。
上記の課題に対処するために、この論文では、より少ない領域を使用してモデルの解釈可能性を高めることを目的として、上記の画像の帰属問題をサブモジュールのサブセット選択問題として再モデル化します。
局所領域への注意の欠如に対処するために、より正確な細粒度の解釈領域を発見するための新しいサブモジュール関数を構築します。
すべてのサンプルのアトリビューション効果を高めるために、サブ領域の選択に 4 つの異なる制約 (信頼度、有効性、一貫性、コラボレーション スコア) を課して、さまざまなサブセットの重要性を評価します。
さらに、私たちの理論分析は、提案された関数が実際にはサブモジュールであることを実証しています。
広範な実験により、提案された方法が 2 つの顔データセット (Celeb-A および VGG-Face2) と 1 つのきめ細かいデータセット (CUB-200-2011) に対して SOTA 方法よりも優れていることが示されています。
正しく予測されたサンプルの場合、提案された方法は、HSIC アトリビューションと比較して、削除スコアと挿入スコアを平均 4.9% および 2.5% 向上させます。
誤って予測されたサンプルについて、私たちの方法は、HSIC アトリビューション アルゴリズムと比較して、平均最高信頼度および挿入スコアでそれぞれ 81.0% と 18.4% の向上を達成しました。
コードは https://github.com/RuoyuChen10/SMDL-Attribution で公開されています。

要約(オリジナル)

Image attribution algorithms aim to identify important regions that are highly relevant to model decisions. Although existing attribution solutions can effectively assign importance to target elements, they still face the following challenges: 1) existing attribution methods generate inaccurate small regions thus misleading the direction of correct attribution, and 2) the model cannot produce good attribution results for samples with wrong predictions. To address the above challenges, this paper re-models the above image attribution problem as a submodular subset selection problem, aiming to enhance model interpretability using fewer regions. To address the lack of attention to local regions, we construct a novel submodular function to discover more accurate fine-grained interpretation regions. To enhance the attribution effect for all samples, we also impose four different constraints on the selection of sub-regions, i.e., confidence, effectiveness, consistency, and collaboration scores, to assess the importance of various subsets. Moreover, our theoretical analysis substantiates that the proposed function is in fact submodular. Extensive experiments show that the proposed method outperforms SOTA methods on two face datasets (Celeb-A and VGG-Face2) and one fine-grained dataset (CUB-200-2011). For correctly predicted samples, the proposed method improves the Deletion and Insertion scores with an average of 4.9% and 2.5% gain relative to HSIC-Attribution. For incorrectly predicted samples, our method achieves gains of 81.0% and 18.4% compared to the HSIC-Attribution algorithm in the average highest confidence and Insertion score respectively. The code is released at https://github.com/RuoyuChen10/SMDL-Attribution.

arxiv情報

著者 Ruoyu Chen,Hua Zhang,Siyuan Liang,Jingzhi Li,Xiaochun Cao
発行日 2024-02-14 13:30:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク