Argument Attribution Explanations in Quantitative Bipolar Argumentation Frameworks (Technical Report)


近年、議論的説明可能 AI が提唱されており、議論フレームワーク (AF) の推論結果の説明に対する関心が高まっています。
拡張ベースのセマンティクスの精神に基づく議論/論争/対話による AF の推論結果を定性的に説明する研究は数多くありますが、段階的セマンティクスに基づく AF の定量的推論結果の説明は、広く使用されているにもかかわらず、あまり注目されていません。
この論文では、定量的双極議論フレームワーク (QBAF) のコンテキストで機械学習からの特徴属性の精神を組み込むことにより、議論属性説明 (AAE) の新しい理論を提案することで、このギャップを埋めることに貢献します。一方、特徴属性は次の目的で使用されます。
機械学習モデルの出力に対する特徴の影響を決定するために、AAE は、関心のあるトピックの議論に対する議論の影響を決定するために使用されます。
私たちは、いくつかの新しいものや文献から私たちの設定に部分的に適応したものを含む、AAE の望ましい特性を研究しています。
実際の AAE の適用可能性を実証するために、最後に、フェイク ニュース検出と映画レコメンダー システムのシナリオで 2 つのケース スタディを実行します。


Argumentative explainable AI has been advocated by several in recent years, with an increasing interest on explaining the reasoning outcomes of Argumentation Frameworks (AFs). While there is a considerable body of research on qualitatively explaining the reasoning outcomes of AFs with debates/disputes/dialogues in the spirit of extension-based semantics, explaining the quantitative reasoning outcomes of AFs under gradual semantics has not received much attention, despite widespread use in applications. In this paper, we contribute to filling this gap by proposing a novel theory of Argument Attribution Explanations (AAEs) by incorporating the spirit of feature attribution from machine learning in the context of Quantitative Bipolar Argumentation Frameworks (QBAFs): whereas feature attribution is used to determine the influence of features towards outputs of machine learning models, AAEs are used to determine the influence of arguments towards topic arguments of interest. We study desirable properties of AAEs, including some new ones and some partially adapted from the literature to our setting. To demonstrate the applicability of our AAEs in practice, we conclude by carrying out two case studies in the scenarios of fake news detection and movie recommender systems.


著者 Xiang Yin,Nico Potyka,Francesca Toni
発行日 2023-07-31 09:47:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI パーマリンク