The Role of Syntactic Span Preferences in Post-Hoc Explanation Disagreement

要約

事後説明方法は、ユーザーに対するモデルの透明性を高めるための重要なツールです。
残念なことに、トークンの重要性を帰属させるために現在使用されている方法では、多くの場合、異なるパターンが生じます。
この研究では、言語の観点から、さまざまな方法における不一致の潜在的な原因を研究します。
私たちは、さまざまな方法がさまざまなクラスの単語を体系的に選択し、他の方法や人間と最もよく一致する方法が同様の言語選好を示すことを発見しました。
メソッド間のトークンレベルの違いは、構文スパンレベルで比較すると平滑化されます。
また、サイズ $k$ の固定サブセットに依存するのではなく、最も重要なスパンを動的に推定することにより、手法間でより高い一致が見出されます。
$k$ とスパンの間の相互作用を体系的に調査し、重要なトークンを選択するための改善された構成を提案します。

要約(オリジナル)

Post-hoc explanation methods are an important tool for increasing model transparency for users. Unfortunately, the currently used methods for attributing token importance often yield diverging patterns. In this work, we study potential sources of disagreement across methods from a linguistic perspective. We find that different methods systematically select different classes of words and that methods that agree most with other methods and with humans display similar linguistic preferences. Token-level differences between methods are smoothed out if we compare them on the syntactic span level. We also find higher agreement across methods by estimating the most important spans dynamically instead of relying on a fixed subset of size $k$. We systematically investigate the interaction between $k$ and spans and propose an improved configuration for selecting important tokens.

arxiv情報

著者 Jonathan Kamp,Lisa Beinborn,Antske Fokkens
発行日 2024-03-28 13:56:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク