Causal Inference from Text: Unveiling Interactions between Variables

要約

潜在共変量の調整は、観察されたテキスト データから因果関係を推定するために重要です。
既存の手法のほとんどは、治療と転帰の両方に影響を与える交絡共変量のみを考慮しており、偏った因果関係につながる可能性があります。
この偏りは、治療または結果のいずれかにのみ関連する非交絡共変量の考慮が不十分なことから生じます。
この研究では、テキストから因果関係を推定する際に、異なる変数間の相互作用を明らかにし、交絡しない共変量を解きほぐすことでバイアスを軽減することを目的としています。
解きほぐすプロセスにより、共変量がそれぞれの目的にのみ寄与することが保証され、変数間の独立性が可能になります。
さらに、選択バイアスを軽減するために、治療グループと対照グループの代表のバランスをとるための制約を課します。
私たちはさまざまなシナリオの下で 2 つの異なる治療因子に関する実験を実施し、提案されたモデルは最近の強力なベースラインを大幅に上回りました。
さらに、決算報告の記録に関する当社の徹底的な分析は、当社のモデルが変数を効果的に解きほぐすことができることを実証しており、現実世界のシナリオをさらに調査することで、投資家が情報に基づいた意思決定を行うための指針を提供します。

要約(オリジナル)

Adjusting for latent covariates is crucial for estimating causal effects from observational textual data. Most existing methods only account for confounding covariates that affect both treatment and outcome, potentially leading to biased causal effects. This bias arises from insufficient consideration of non-confounding covariates, which are relevant only to either the treatment or the outcome. In this work, we aim to mitigate the bias by unveiling interactions between different variables to disentangle the non-confounding covariates when estimating causal effects from text. The disentangling process ensures covariates only contribute to their respective objectives, enabling independence between variables. Additionally, we impose a constraint to balance representations from the treatment group and control group to alleviate selection bias. We conduct experiments on two different treatment factors under various scenarios, and the proposed model significantly outperforms recent strong baselines. Furthermore, our thorough analysis on earnings call transcripts demonstrates that our model can effectively disentangle the variables, and further investigations into real-world scenarios provide guidance for investors to make informed decisions.

arxiv情報

著者 Yuxiang Zhou,Yulan He
発行日 2023-11-09 11:29:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク