Code Book for the Annotation of Diverse Cross-Document Coreference of Entities in News Articles

要約

この論文では、ニュース記事全体にわたる相互参照に注釈を付けるためのスキームを提示します。これは、類似関係やブリッジ関係も考慮することで、従来の同一関係を超えて拡張されます。
これには、Inception の設定方法、それぞれの注釈ツール、ニュース記事内のエンティティに注釈を付ける方法、それらをさまざまな相互参照関係に結び付ける方法、文書全体でウィキデータのグローバル ナレッジ グラフにリンクする方法についての正確な説明が含まれています。
この多層アノテーションのアプローチは、メディアのバイアスの問題と関連して説明されます。
私たちの主な貢献は、単語の選択とラベル付けによるメディアの偏りの分析に適用できる、多様な文書間相互参照コーパスを作成するための方法論を提供することにあります。

要約(オリジナル)

This paper presents a scheme for annotating coreference across news articles, extending beyond traditional identity relations by also considering near-identity and bridging relations. It includes a precise description of how to set up Inception, a respective annotation tool, how to annotate entities in news articles, connect them with diverse coreferential relations, and link them across documents to Wikidata’s global knowledge graph. This multi-layered annotation approach is discussed in the context of the problem of media bias. Our main contribution lies in providing a methodology for creating a diverse cross-document coreference corpus which can be applied to the analysis of media bias by word-choice and labelling.

arxiv情報

著者 Jakob Vogel
発行日 2023-10-18 15:53:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク