CHIRON: Rich Character Representations in Long-Form Narratives

要約

キャラクターは長編物語に不可欠ですが、既存のストーリー分析や生成システムではほとんど理解されていません。
これまでの研究では、グラフベースの手法と簡単なキャラクター説明によってキャラクターを簡素化していましたが、私たちはプロのライターに与えられたアドバイスからインスピレーションを得て、複雑なキャラクターを表現するという問題にもっとうまく取り組むことを目指しています。
我々は、文字に関するテキスト情報を整理およびフィルタリングする新しい「文字シート」ベースの表現である CHIRON を提案します。
CHIRON シートは 2 つのステップで構築されます。1 つは質問応答を通じて LLM にキャラクター情報の入力を求める生成モジュール、もう 1 つは自動推論とドメイン固有の含意モデルを使用してキャラクターに関する誤った事実を排除する検証モジュールです。
私たちは、マスクされた文字予測の下流タスクを通じて CHIRON を検証します。実験では、CHIRON が同等の概要ベースのベースラインよりも優れており、より柔軟であることが示されています。
また、CHIRON から得られた指標を使用して、ストーリーのキャラクター中心性を自動的に推測できること、およびこれらの指標が人間の判断と一致することも示します。

要約(オリジナル)

Characters are integral to long-form narratives, but are poorly understood by existing story analysis and generation systems. While prior work has simplified characters via graph-based methods and brief character descriptions, we aim to better tackle the problem of representing complex characters by taking inspiration from advice given to professional writers. We propose CHIRON, a new `character sheet’ based representation that organizes and filters textual information about characters. We construct CHIRON sheets in two steps: a Generation Module that prompts an LLM for character information via question-answering and a Validation Module that uses automated reasoning and a domain-specific entailment model to eliminate false facts about a character. We validate CHIRON via the downstream task of masked-character prediction, where our experiments show CHIRON is better and more flexible than comparable summary-based baselines. We also show that metrics derived from CHIRON can be used to automatically infer character-centricity in stories, and that these metrics align with human judgments.

arxiv情報

著者 Alexander Gurung,Mirella Lapata
発行日 2024-06-26 14:22:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク