Guidelines For The Choice Of The Baseline in XAI Attribution Methods

要約

人工知能の幅広い採用を考えると、AIモデルが信頼性が高く、信頼できる、公平であるという証拠を提供することが不可欠です。
この目的のために、説明可能なAIの新たな分野は、このような要件を調査するための技術を開発し、この技術の普及を推進する誇大広告を相殺します。
この問題の多くの側面の中で、このペーパーでは、通常は「ベースライン」と呼ばれる「ニュートラルな」刺激に依存して、ネットワーク入力に特徴属性マップを導出することを目的としたベースライン属性方法に焦点を当てています。
ベースラインの選択は、ネットワークの動作の説明を決定するため、重要です。
このフレームワークでは、このペーパーでは、ベースラインの選択の意味に光を当て、タスクに最適なベースラインを特定するためのシンプルで効果的な方法を提供するという2つの目標があります。
これを達成するために、ベースラインは定義上、自然に検索ドメインになる決定境界にあるため、決定境界サンプリング方法を提案します。
実験は合成例で実行され、最先端の方法に依存して検証されています。
実験範囲に限定されているにもかかわらず、この貢献は、明確なガイドラインとベースライン選択のための簡単なプロキシを提供し、曖昧さを減らし、深いモデルの信頼性と信頼を高めるための単純なプロキシを提供するため、関連しています。

要約(オリジナル)

Given the broad adoption of artificial intelligence, it is essential to provide evidence that AI models are reliable, trustable, and fair. To this end, the emerging field of eXplainable AI develops techniques to probe such requirements, counterbalancing the hype pushing the pervasiveness of this technology. Among the many facets of this issue, this paper focuses on baseline attribution methods, aiming at deriving a feature attribution map at the network input relying on a ‘neutral’ stimulus usually called ‘baseline’. The choice of the baseline is crucial as it determines the explanation of the network behavior. In this framework, this paper has the twofold goal of shedding light on the implications of the choice of the baseline and providing a simple yet effective method for identifying the best baseline for the task. To achieve this, we propose a decision boundary sampling method, since the baseline, by definition, lies on the decision boundary, which naturally becomes the search domain. Experiments are performed on synthetic examples and validated relying on state-of-the-art methods. Despite being limited to the experimental scope, this contribution is relevant as it offers clear guidelines and a simple proxy for baseline selection, reducing ambiguity and enhancing deep models’ reliability and trust.

arxiv情報

著者 Cristian Morasso,Giorgio Dolci,Ilaria Boscolo Galazzo,Sergey M. Plis,Gloria Menegaz
発行日 2025-03-25 16:25:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク