Interpretability Analysis of Domain Adapted Dense Retrievers

要約

デンス・レトリバーは神経情報検索において大きな可能性を示している。
ただし、ドメインのシフトに対する堅牢性が欠けているため、さまざまなドメインにわたるゼロショット設定での有効性が制限されます。
これまでの研究では、デンス・レトリーバーをターゲット・ドメインに適応させるための教師なしドメイン適応技術が調査されてきました。
ただし、これらの研究は、そのような適応によってモデルの動作がどのように変化するかを理解するための説明可能性分析には焦点を当てていません。
この論文では、統合勾配フレームワークを利用して、高密度リトリーバーに対してインスタンスベースとランキングベースの両方の説明を提供する解釈可能性手法を開発することを提案します。
これらの説明を生成するために、クエリとドキュメントの属性の両方を明らかにする新しいベースラインを導入します。
この方法は、金融質問応答データセット (FIQA) と生物医学情報検索データセット (TREC-COVID) の 2 つのデータセットにわたるクエリ トークンとドキュメント トークンの入力属性に対するドメイン適応の影響を分析するために使用されます。
私たちの視覚化により、ドメイン適応モデルは、非適応モデルと比較して、「ヘッジ」、「金」、「コロナ」、「病気」などの用語に代表されるドメイン内の用語に重点を置いていることが明らかになりました。
この研究では、教師なしドメイン適応技術が、新しいドメインに適応した際のデンス・レトリーバーの動作にどのような影響を与えるかを取り上げています。
さらに、統合勾配がこれらの不透明なニューラル モデルの内部メカニズムを説明および分析するための実行可能な選択肢であることを示します。

要約(オリジナル)

Dense retrievers have demonstrated significant potential for neural information retrieval; however, they exhibit a lack of robustness to domain shifts, thereby limiting their efficacy in zero-shot settings across diverse domains. Previous research has investigated unsupervised domain adaptation techniques to adapt dense retrievers to target domains. However, these studies have not focused on explainability analysis to understand how such adaptations alter the model’s behavior. In this paper, we propose utilizing the integrated gradients framework to develop an interpretability method that provides both instance-based and ranking-based explanations for dense retrievers. To generate these explanations, we introduce a novel baseline that reveals both query and document attributions. This method is used to analyze the effects of domain adaptation on input attributions for query and document tokens across two datasets: the financial question answering dataset (FIQA) and the biomedical information retrieval dataset (TREC-COVID). Our visualizations reveal that domain-adapted models focus more on in-domain terminology compared to non-adapted models, exemplified by terms such as ‘hedge,’ ‘gold,’ ‘corona,’ and ‘disease.’ This research addresses how unsupervised domain adaptation techniques influence the behavior of dense retrievers when adapted to new domains. Additionally, we demonstrate that integrated gradients are a viable choice for explaining and analyzing the internal mechanisms of these opaque neural models.

arxiv情報

著者 Goksenin Yuksel,Jaap Kamps
発行日 2025-01-24 12:42:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.IR パーマリンク