要約
映画の脚本の要約には、標準的な文書の要約と比較して、独特の一連の課題があります。
脚本は長いだけでなく、登場人物、会話、シーンの複雑な相互作用を特徴としており、機械学習モデルが正確に把握して理解するのが難しい直接的かつ微妙な関係や文脈上のニュアンスが多数含まれています。
脚本要約の最近の試みは、トランスフォーマーベースの事前トレーニング済みモデルの微調整に焦点を当てていますが、これらのモデルは長期的な依存関係や潜在的な関係を捉えるには不十分なことが多く、「途中で失われた」問題に頻繁に遭遇します。
これらの課題に対処するために、映画の脚本を映画のキャラクターを意識した談話グラフ (CaD Graph) として表す新しいリソースである DiscoGraMS を紹介します。
このアプローチは、要約、質問応答、顕著性の検出など、さまざまな下流タスクに適しています。
このモデルは、すべての重要な情報を保存し、脚本の内容をより包括的かつ忠実に表現することを目的としています。
我々は、グラフとテキストモダリティの後期融合を通じて、CaD グラフと対応する映画スクリプトを組み合わせるベースライン手法をさらに探索し、非常に初期の有望な結果を提示します。
要約(オリジナル)
Summarizing movie screenplays presents a unique set of challenges compared to standard document summarization. Screenplays are not only lengthy, but also feature a complex interplay of characters, dialogues, and scenes, with numerous direct and subtle relationships and contextual nuances that are difficult for machine learning models to accurately capture and comprehend. Recent attempts at screenplay summarization focus on fine-tuning transformer-based pre-trained models, but these models often fall short in capturing long-term dependencies and latent relationships, and frequently encounter the ‘lost in the middle’ issue. To address these challenges, we introduce DiscoGraMS, a novel resource that represents movie scripts as a movie character-aware discourse graph (CaD Graph). This approach is well-suited for various downstream tasks, such as summarization, question-answering, and salience detection. The model aims to preserve all salient information, offering a more comprehensive and faithful representation of the screenplay’s content. We further explore a baseline method that combines the CaD Graph with the corresponding movie script through a late fusion of graph and text modalities, and we present very initial promising results.
arxiv情報
著者 | Maitreya Prafulla Chitale,Uday Bindal,Rajakrishnan Rajkumar,Rahul Mishra |
発行日 | 2024-10-18 17:56:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google