Disentangling Structure and Style: Political Bias Detection in News by Inducing Document Hierarchy

要約

私たちは、ニュース記事内の政治的偏見を検出する際の重要なギャップに対処します。
文書分類を実行する以前の研究は、各報道機関の書き方の影響を受ける可能性があり、過剰適合や一般化可能性の制限につながる可能性があります。
私たちのアプローチは、文レベルの意味論と文書レベルの修辞構造の両方を考慮することでこの制限を克服し、その結果、ニュース記事内の政治的偏見を検出するための、より堅牢でスタイルに依存しないアプローチが実現します。
我々は、アテンションヘッドの多様なアンサンブルを通じて長い文書の構造を効果的にエンコードする、新しいマルチヘッド階層型アテンションモデルを導入します。
ジャーナリズムは形式化された修辞構造に従いますが、報道スタイルは報道機関によって異なる場合があります。
私たちの方法がこのドメイン依存性を克服し、堅牢性と精度の点で以前のアプローチよりも優れていることを実証します。
さらなる分析と人間による評価により、私たちのモデルがジャーナリズムにおける一般的な言説構造を捕捉できることが実証されました。
コードは https://github.com/xfactlab/emnlp2023-Document-Hierarchy から入手できます。

要約(オリジナル)

We address an important gap in detecting political bias in news articles. Previous works that perform document classification can be influenced by the writing style of each news outlet, leading to overfitting and limited generalizability. Our approach overcomes this limitation by considering both the sentence-level semantics and the document-level rhetorical structure, resulting in a more robust and style-agnostic approach to detecting political bias in news articles. We introduce a novel multi-head hierarchical attention model that effectively encodes the structure of long documents through a diverse ensemble of attention heads. While journalism follows a formalized rhetorical structure, the writing style may vary by news outlet. We demonstrate that our method overcomes this domain dependency and outperforms previous approaches for robustness and accuracy. Further analysis and human evaluation demonstrate the ability of our model to capture common discourse structures in journalism. Our code is available at: https://github.com/xfactlab/emnlp2023-Document-Hierarchy

arxiv情報

著者 Jiwoo Hong,Yejin Cho,Jaemin Jung,Jiyoung Han,James Thorne
発行日 2023-10-27 11:35:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク