Accurate Use of Label Dependency in Multi-Label Text Classification Through the Lens of Causality

要約

マルチラベル テキスト分類 (MLTC) は、指定された各テキストに最も関連性の高いラベルを割り当てることを目的としています。
既存の方法は、ラベルの依存関係がモデルのパフォーマンスの向上に役立つことを示しています。
ただし、ラベル依存性の導入により、モデルに望ましくない予測バイアスが発生する可能性があります。
この研究では、モデルのラベル依存関係の誤用がバイアスの原因であると考えています。つまり、モデルは、予測のためにテキスト情報とラベル依存関係を融合するのではなく、ラベル依存関係の相関ショートカットを利用する傾向があります。
因果推論を動機として、相関バイアスを排除し、因果関係に基づいた予測を行うための CounterFactual Text Classifier (CFTC) を提案します。
具体的には、当社の CFTC はまず、predict-then-modify バックボーンを採用してラベル依存関係に埋め込まれた正確なラベル情報を抽出し、次に人間の因果関係グラフの助けを借りた反事実的バイアス除去技術を通じて相関ショートカットをブロックします。
3 つのデータセットに関する実験結果は、CFTC がベースラインを大幅に上回っており、データセット内の相関バイアスを効果的に排除していることを示しています。

要約(オリジナル)

Multi-Label Text Classification (MLTC) aims to assign the most relevant labels to each given text. Existing methods demonstrate that label dependency can help to improve the model’s performance. However, the introduction of label dependency may cause the model to suffer from unwanted prediction bias. In this study, we attribute the bias to the model’s misuse of label dependency, i.e., the model tends to utilize the correlation shortcut in label dependency rather than fusing text information and label dependency for prediction. Motivated by causal inference, we propose a CounterFactual Text Classifier (CFTC) to eliminate the correlation bias, and make causality-based predictions. Specifically, our CFTC first adopts the predict-then-modify backbone to extract precise label information embedded in label dependency, then blocks the correlation shortcut through the counterfactual de-bias technique with the help of the human causal graph. Experimental results on three datasets demonstrate that our CFTC significantly outperforms the baselines and effectively eliminates the correlation bias in datasets.

arxiv情報

著者 Caoyun Fan,Wenqing Chen,Jidong Tian,Yitian Li,Hao He,Yaohui Jin
発行日 2023-10-11 15:28:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク