OpenXAI: Towards a Transparent Evaluation of Model Explanations

要約

最近の文献では数種類の事後説明手法が提案されていますが、これらの手法を体系的にベンチマークする取り組みはほとんどありません。
ここでは、事後説明方法を評価およびベンチマークするための包括的で拡張可能なオープンソース フレームワークである OpenXAI を紹介します。
OpenXAI は、次の主要コンポーネントで構成されます: (i) 柔軟な合成データ ジェネレーターと、さまざまな現実世界のデータセット、事前トレーニングされたモデル、最先端の特徴帰属手法のコレクション、(ii) オープンソース
説明手法の忠実性、安定性(堅牢性)、公平性を評価するための 11 の定量的指標を実装し、さまざまな指標、モデル、データセットにわたるいくつかの説明手法の比較を提供します。
OpenXAI は、ユーザーがカスタムの説明メソッドを簡単に評価してリーダーボードに組み込むことができるため、簡単に拡張できます。
全体として、OpenXAI は自動化されたエンドツーエンドのパイプラインを提供し、事後説明メソッドの評価を簡素化および標準化するだけでなく、これらのメソッドのベンチマークにおける透明性と再現性も促進します。
OpenXAI の最初のリリースは表形式のデータセットのみをサポートしていますが、私たちが検討している説明方法とメトリクスは、他のデータ モダリティにも適用できるほど一般的です。
OpenXAI データセットとモデル、最先端の説明方法と評価メトリクスの実装は、この GitHub リンクで公開されています。

要約(オリジナル)

While several types of post hoc explanation methods have been proposed in recent literature, there is very little work on systematically benchmarking these methods. Here, we introduce OpenXAI, a comprehensive and extensible open-source framework for evaluating and benchmarking post hoc explanation methods. OpenXAI comprises of the following key components: (i) a flexible synthetic data generator and a collection of diverse real-world datasets, pre-trained models, and state-of-the-art feature attribution methods, and (ii) open-source implementations of eleven quantitative metrics for evaluating faithfulness, stability (robustness), and fairness of explanation methods, in turn providing comparisons of several explanation methods across a wide variety of metrics, models, and datasets. OpenXAI is easily extensible, as users can readily evaluate custom explanation methods and incorporate them into our leaderboards. Overall, OpenXAI provides an automated end-to-end pipeline that not only simplifies and standardizes the evaluation of post hoc explanation methods, but also promotes transparency and reproducibility in benchmarking these methods. While the first release of OpenXAI supports only tabular datasets, the explanation methods and metrics that we consider are general enough to be applicable to other data modalities. OpenXAI datasets and models, implementations of state-of-the-art explanation methods and evaluation metrics, are publicly available at this GitHub link.

arxiv情報

著者 Chirag Agarwal,Dan Ley,Eshika Saxena,Satyapriya Krishna,Martin Pawelczyk,Nari Johnson,Isha Puri,Marinka Zitnik,Himabindu Lakkaraju
発行日 2024-03-11 17:31:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク