Interactive Explanations by Conflict Resolution via Argumentative Exchanges

要約

説明可能な AI (XAI) の分野が成熟するにつれて、AI モデル (の出力) のインタラクティブな説明を求める声が高まっていますが、最先端の技術は主に静的な説明に焦点を当てています。
このホワイト ペーパーでは、代わりに、コンピューターによる議論を活用することにより、エージェント (つまり、AI モデルおよび/または人間) 間の競合解決として構成されたインタラクティブな説明に焦点を当てます。
具体的には、エージェント間の競合の解決に向けて、個々のエージェントの定量的双極性議論フレームワークに含まれる情報をマルチエージェント システムで動的に共有するための Argumentative eXchanges (AX) を定義します。
次に、マシンと人間がマシンの予測について対話する XAI 設定で AX を展開します。
XAIに適したAXを特徴付けるいくつかの理論的特性を特定して評価します。
最後に、さまざまなエージェントの動作を定義することにより、XAI の AX をインスタンス化します。
機械で推論の反事実パターンを捉え、人間の認知バイアスの影響を強調します。
我々は実験的に (シミュレートされた環境で) 競合解決の観点からこれらの行動の比較優位性を示し、最も強力な議論が常に最も効果的であるとは限らないことを示します.

要約(オリジナル)

As the field of explainable AI (XAI) is maturing, calls for interactive explanations for (the outputs of) AI models are growing, but the state-of-the-art predominantly focuses on static explanations. In this paper, we focus instead on interactive explanations framed as conflict resolution between agents (i.e. AI models and/or humans) by leveraging on computational argumentation. Specifically, we define Argumentative eXchanges (AXs) for dynamically sharing, in multi-agent systems, information harboured in individual agents’ quantitative bipolar argumentation frameworks towards resolving conflicts amongst the agents. We then deploy AXs in the XAI setting in which a machine and a human interact about the machine’s predictions. We identify and assess several theoretical properties characterising AXs that are suitable for XAI. Finally, we instantiate AXs for XAI by defining various agent behaviours, e.g. capturing counterfactual patterns of reasoning in machines and highlighting the effects of cognitive biases in humans. We show experimentally (in a simulated environment) the comparative advantages of these behaviours in terms of conflict resolution, and show that the strongest argument may not always be the most effective.

arxiv情報

著者 Antonio Rago,Hengzhi Li,Francesca Toni
発行日 2023-03-27 09:15:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.MA, I.2.4 パーマリンク