Unsupervised Location Mapping for Narrative Corpora

要約

この作品は、監視されていないロケーションマッピングのタスクを提示します。これは、個々の物語の軌跡を、大きな物語のセットが行われる場所の空間地図にマッピングしようとします。
タスクの基本と一般性にもかかわらず、物語テキストの空間マッピングに対処する作業はほとんどありませんでした。
タスクは2つの部分で構成されています。(1)テキストのセットに記載されている場所に「マップ」を誘導し、(2)単一の物語から軌跡を抽出し、マップ上に配置する。
大規模な言語モデルのコンテキスト長を増やす際の最近の進歩に続いて、ラベルのセットを事前に定義することなく、完全に監視されていない方法でこのタスクのパイプラインを提案します。
(1)ホロコーストの証言と(2)湖水地方の執筆、すなわち、英国湖水地方の旅行に関する多世紀の文献で、2つの異なるドメインでこの方法をテストします。
タスクの固有の評価と外因性の両方の評価を実行し、結果を奨励し、それによりタスクのベンチマークと評価慣行を設定し、課題を強調します。

要約(オリジナル)

This work presents the task of unsupervised location mapping, which seeks to map the trajectory of an individual narrative on a spatial map of locations in which a large set of narratives take place. Despite the fundamentality and generality of the task, very little work addressed the spatial mapping of narrative texts. The task consists of two parts: (1) inducing a “map” with the locations mentioned in a set of texts, and (2) extracting a trajectory from a single narrative and positioning it on the map. Following recent advances in increasing the context length of large language models, we propose a pipeline for this task in a completely unsupervised manner without predefining the set of labels. We test our method on two different domains: (1) Holocaust testimonies and (2) Lake District writing, namely multi-century literature on travels in the English Lake District. We perform both intrinsic and extrinsic evaluations for the task, with encouraging results, thereby setting a benchmark and evaluation practices for the task, as well as highlighting challenges.

arxiv情報

著者 Eitan Wagner,Renana Keydar,Omri Abend
発行日 2025-04-08 12:06:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク