Disentangling Structure and Style: Political Bias Detection in News by Inducing Document Hierarchy

要約

タイトル:文書階層を誘発することによる政治的バイアス検出:構造とスタイルの分離

要約:

・以前の研究では、監視された文書分類に偏りが生じ、過学習や一般化が制限される可能性がある

・本研究では、文書レベルの修辞的構造と文レベルの意味を考慮し、より堅牢でスタイルに依存しない方法を提案して、ニュース記事における政治的バイアスの検出に重点を置いている

・多頭階層的注意モデルを導入し、長いドキュメントの構造を統合的に表現する方法を提案している

・ジャーナリズムは、形式化された修辞構造に従っているが、ニュースアウトレットによっては書き方が異なることがある

・本手法は、ドメイン依存性を克服し、頑健性と精度が以前の手法よりも良いことを実証している

・さらなる分析により、本モデルがジャーナリズムドメインで一般的に使用されるディスコース構造を捉える能力があることがわかった。

要約(オリジナル)

We address an important gap in detection of political bias in news articles. Previous works that perform supervised document classification can be biased towards the writing style of each news outlet, leading to overfitting and limited generalizability. Our approach overcomes this limitation by considering both the sentence-level semantics and the document-level rhetorical structure, resulting in a more robust and style-agnostic approach to detecting political bias in news articles. We introduce a novel multi-head hierarchical attention model that effectively encodes the structure of long documents through a diverse ensemble of attention heads. While journalism follows a formalized rhetorical structure, the writing style may vary by news outlet. We demonstrate that our method overcomes this domain dependency and outperforms previous approaches for robustness and accuracy. Further analysis demonstrates the ability of our model to capture the discourse structures commonly used in the journalism domain.

arxiv情報

著者 Jiwoo Hong,Yejin Cho,Jaemin Jung,Jiyoung Han,James Thorne
発行日 2023-04-05 06:35:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.LG パーマリンク