Characterizing Latent Perspectives of Media Houses Towards Public Figures

要約

著名人について報道するメディア会社には、それぞれの世界観に由来する独自の偏見が伴うことがよくあります。
これらの根底にあるパターンを特徴付けることは、ニュース記事をよりよく理解して解釈するのに役立ちます。
このためには、多様な、または主観的な要約が必要ですが、事前に定義されたクラスラベルに分類するには適さない可能性があります。
この研究では、GPT-2 を使用してコーパスから人物エンティティの非抽出的または生成的な特徴付けを行うためのゼロショット アプローチを提案しています。
私たちは、このアプローチに対する健全な議論を構築するためのコーパスとして、いくつかの有名な報道機関からの明確に表現された記事を使用します。
まず、特定の人物エンティティが特徴付けられるコーパスを使用して、GPT-2 の事前トレーニング済み言語モデルを微調整します。
次に、プログラムで構築された特徴付けのコーパスから作成された人物エンティティの特徴付けのデモンストレーションを使用して、これをさらに微調整します。
この 2 回微調整されたモデルには、2 回目の微調整では以前に検出されなかったエンティティ名で構成される手動プロンプトが用意されており、エンティティに関する簡単な文が生成されます。
コーパスから得られた実際の特徴と比較すると、結果は有望なものでした。

要約(オリジナル)

Media houses reporting on public figures, often come with their own biases stemming from their respective worldviews. A characterization of these underlying patterns helps us in better understanding and interpreting news stories. For this, we need diverse or subjective summarizations, which may not be amenable for classifying into predefined class labels. This work proposes a zero-shot approach for non-extractive or generative characterizations of person entities from a corpus using GPT-2. We use well-articulated articles from several well-known news media houses as a corpus to build a sound argument for this approach. First, we fine-tune a GPT-2 pre-trained language model with a corpus where specific person entities are characterized. Second, we further fine-tune this with demonstrations of person entity characterizations, created from a corpus of programmatically constructed characterizations. This twice fine-tuned model is primed with manual prompts consisting of entity names that were not previously encountered in the second fine-tuning, to generate a simple sentence about the entity. The results were encouraging, when compared against actual characterizations from the corpus.

arxiv情報

著者 Sharath Srivatsa,Srinath Srinivasa
発行日 2023-09-12 10:27:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク