Text-Transport: Toward Learning Causal Effects of Natural Language

要約

言語テクノロジーが現実の環境で重要になるにつれて、言語の変更が読者の認識にどのような影響を与えるかを理解することが重要です。
これは、テキストに対する読者の反応に対する言語的属性 (感情など) の変化の因果関係として形式化できます。
本稿では、任意のテキスト分布の下で自然言語から因果関係を推定する手法である Text-Transport を紹介します。
有効な因果効果を推定するための現在のアプローチでは、データに関する強力な仮定が必要です。つまり、有効な因果効果を推定できるデータは、多くの場合、実際の対象領域を表していません。
この問題に対処するために、分布シフトの概念を活用して、ターゲット ドメインでの強い仮定の必要性を回避し、ドメイン間の因果関係を伝達する推定量を記述します。
私たちは、この推定量の不確実性について統計的な保証を導き出し、データ設定全体での Text-Transport の妥当性を裏付ける経験的結果と分析を報告します。
最後に、テキスト トランスポートを使用して、因果関係がテキスト ドメイン間で大きく変化する現実的な設定 (ソーシャル メディアでのヘイト スピーチ) を研究し、自然言語の因果推論を行う際のトランスポートの必要性を示します。

要約(オリジナル)

As language technologies gain prominence in real-world settings, it is important to understand how changes to language affect reader perceptions. This can be formalized as the causal effect of varying a linguistic attribute (e.g., sentiment) on a reader’s response to the text. In this paper, we introduce Text-Transport, a method for estimation of causal effects from natural language under any text distribution. Current approaches for valid causal effect estimation require strong assumptions about the data, meaning the data from which one can estimate valid causal effects often is not representative of the actual target domain of interest. To address this issue, we leverage the notion of distribution shift to describe an estimator that transports causal effects between domains, bypassing the need for strong assumptions in the target domain. We derive statistical guarantees on the uncertainty of this estimator, and we report empirical results and analyses that support the validity of Text-Transport across data settings. Finally, we use Text-Transport to study a realistic setting–hate speech on social media–in which causal effects do shift significantly between text domains, demonstrating the necessity of transport when conducting causal inference on natural language.

arxiv情報

著者 Victoria Lin,Louis-Philippe Morency,Eli Ben-Michael
発行日 2023-10-31 17:56:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, stat.ME パーマリンク