Mapping News Narratives Using LLMs and Narrative-Structured Text Embeddings

要約

個人のアイデンティティから国際政治に至るまで、さまざまな社会レベルにわたる物語の重大な影響を考えると、時間の経過とともにその分布と発展を理解することが重要です。
これはオンライン空間では特に重要です。
ウェブ上では、物語が急速に広がり、社会の分断や紛争が激化する可能性があります。
多くの定性的アプローチが存在しますが、ナラティブを定量化することは依然として大きな課題です。
コンピュータによるナラティブ分析には、包括的かつ一般化可能なフレームワークが欠けています。
このギャップに対処するために、構造主義言語理論に基づいた数値的な物語表現を導入します。
主に、Greimas の Actantial モデルは、6 つの機能的なキャラクターの役割の集合を通じて物語を表します。
これらのいわゆるアクターはジャンルに依存しないため、モデルは非常に一般化可能です。
オープンソース LLM を使用してアクタントを抽出し、テキストの意味論と物語構造の両方をキャプチャする物語構造テキスト埋め込みにそれらを統合します。
イスラエルとパレスチナ紛争に関するアルジャジーラとワシントンポストの 5,000 件の全文ニュース記事を例に、この方法の分析的洞察を示します。
私たちの方法は、同じトピックを扱っているが、物語の構造が異なる記事をうまく区別します。

要約(オリジナル)

Given the profound impact of narratives across various societal levels, from personal identities to international politics, it is crucial to understand their distribution and development over time. This is particularly important in online spaces. On the Web, narratives can spread rapidly and intensify societal divides and conflicts. While many qualitative approaches exist, quantifying narratives remains a significant challenge. Computational narrative analysis lacks frameworks that are both comprehensive and generalizable. To address this gap, we introduce a numerical narrative representation grounded in structuralist linguistic theory. Chiefly, Greimas’ Actantial Model represents a narrative through a constellation of six functional character roles. These so-called actants are genre-agnostic, making the model highly generalizable. We extract the actants using an open-source LLM and integrate them into a Narrative-Structured Text Embedding that captures both the semantics and narrative structure of a text. We demonstrate the analytical insights of the method on the example of 5000 full-text news articles from Al Jazeera and The Washington Post on the Israel-Palestine conflict. Our method successfully distinguishes articles that cover the same topics but differ in narrative structure.

arxiv情報

著者 Jan Elfes
発行日 2024-09-10 14:15:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク