要約
以前の研究では、PLMベースの検索モデルがLLM生成コンテンツの好みを示すことがわかっており、セマンティック品質が人間が書いたものに匹敵する場合でも、これらのドキュメントに関連性の高いスコアを割り当てています。
ソースバイアスとして知られるこの現象は、情報アクセスエコシステムの持続可能な開発を脅かしています。
ただし、ソースバイアスの根本的な原因は未開拓のままです。
この論文では、因果グラフで情報検索のプロセスを説明し、PLMベースのレトリーバーが関連性推定のために困惑の特徴を学習し、低い困惑のあるドキュメントをランク付けすることによりソースバイアスを引き起こすことを発見します。
理論分析により、この現象は、言語モデリングタスクと検索タスクの損失関数の勾配間の正の相関に起因することがさらに明らかになりました。
分析に基づいて、因果診断と補正(CDC)と呼ばれる因果関係の推論時間衰弱法が提案されています。
CDCは最初に困惑のバイアス効果を診断し、次にバイアス効果を全体的な推定関連スコアから分離します。
3つのドメインにわたる実験結果は、CDCの優れた紛失効果を示しており、提案された説明フレームワークの妥当性を強調しています。
ソースコードは、https://github.com/whydwelledonai/perplexity-trapで入手できます。
要約(オリジナル)
Previous studies have found that PLM-based retrieval models exhibit a preference for LLM-generated content, assigning higher relevance scores to these documents even when their semantic quality is comparable to human-written ones. This phenomenon, known as source bias, threatens the sustainable development of the information access ecosystem. However, the underlying causes of source bias remain unexplored. In this paper, we explain the process of information retrieval with a causal graph and discover that PLM-based retrievers learn perplexity features for relevance estimation, causing source bias by ranking the documents with low perplexity higher. Theoretical analysis further reveals that the phenomenon stems from the positive correlation between the gradients of the loss functions in language modeling task and retrieval task. Based on the analysis, a causal-inspired inference-time debiasing method is proposed, called Causal Diagnosis and Correction (CDC). CDC first diagnoses the bias effect of the perplexity and then separates the bias effect from the overall estimated relevance score. Experimental results across three domains demonstrate the superior debiasing effectiveness of CDC, emphasizing the validity of our proposed explanatory framework. Source codes are available at https://github.com/WhyDwelledOnAi/Perplexity-Trap.
arxiv情報
著者 | Haoyu Wang,Sunhao Dai,Haiyuan Zhao,Liang Pang,Xiao Zhang,Gang Wang,Zhenhua Dong,Jun Xu,Ji-Rong Wen |
発行日 | 2025-03-11 17:59:00+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google