Evaluation of FEM and MLFEM AI-explainers in Image Classification tasks with reference-based and no-reference metrics

要約

AIの最も一般的な手法やアルゴリズムは、大多数がブラックボックスである。ブラックボックスは、重要でない問題に対しては(影響の度合いという意味で)許容できる解決策となり得るが、それ以外の問題に対しては致命的な欠陥がある。そのため、ブラックボックスのための説明ツールは急速に開発されてきた。しかし、その品質を評価することは、まだ未解決の課題である。本テクニカルレポートでは、画像・映像分類タスクにおけるCNNの説明のために最近提案されたポストホック説明器FEMとMLFEMについて言及する。また、参照ベースと無参照のメトリクスを用いた評価を提案する。参照ベースの評価指標は、説明マップとグランドトゥルース(心理視覚実験により得られた視線固定密度マップにより表される)の間のピアソン相関係数と類似度を計算したものである。無参照指標として、Alvarez-MelisとJaakkolaによって提案された「安定性」指標を使用する。我々は、この指標の挙動、参照に基づく指標との一致を調べ、入力画像にいくつかの種類の劣化がある場合、この指標は参照に基づく指標と一致することを示す。したがって、この指標は、グランドトゥルースが利用できない場合の説明文の品質評価に用いることができる。

要約(オリジナル)

The most popular methods and algorithms for AI are, for the vast majority, black boxes. Black boxes can be an acceptable solution to unimportant problems (in the sense of the degree of impact) but have a fatal flaw for the rest. Therefore the explanation tools for them have been quickly developed. The evaluation of their quality remains an open research question. In this technical report, we remind recently proposed post-hoc explainers FEM and MLFEM which have been designed for explanations of CNNs in image and video classification tasks. We also propose their evaluation with reference-based and no-reference metrics. The reference-based metrics are Pearson Correlation coefficient and Similarity computed between the explanation maps and the ground truth, which is represented by Gaze Fixation Density Maps obtained due to a psycho-visual experiment. As a no-reference metric we use ‘stability’ metric, proposed by Alvarez-Melis and Jaakkola. We study its behaviour, consensus with reference-based metrics and show that in case of several kind of degradations on input images, this metric is in agreement with reference-based ones. Therefore it can be used for evaluation of the quality of explainers when the ground truth is not available.

arxiv情報

著者 A. Zhukov,J. Benois-Pineau,R. Giot
発行日 2022-12-02 14:55:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, I.4.7 パーマリンク