要約
この記事では、修辞構造理論 (RST) の拡張に基づく、計算による談話分析のための新しい理論的枠組みである拡張修辞構造理論 (eRST) を紹介します。
このフレームワークには、ツリー分割型、非射影型、同時関係を備えた談話関係グラフのほか、分析に説明可能な根拠を与える暗黙的および明示的なシグナルが含まれています。
私たちは、RST や、セグメント化談話表現理論 (SDRT)、ペン談話ツリーバンク (PDTB)、談話依存関係などの他の既存のフレームワークの欠点を調査し、提案された理論の構成要素を使用してこれらに対処します。
データの注釈、検索、視覚化ツールを提供し、200,000 トークンを超える 12 の話し言葉と書き言葉のジャンルを網羅する、当社のフレームワークに従って注釈が付けられた無料で利用できる英語のコーパスを提示および評価します。
最後に、フレームワークにおけるデータの自動解析、評価メトリクス、およびアプリケーションについて説明します。
要約(オリジナル)
In this article we present Enhanced Rhetorical Structure Theory (eRST), a new theoretical framework for computational discourse analysis, based on an expansion of Rhetorical Structure Theory (RST). The framework encompasses discourse relation graphs with tree-breaking, nonprojective and concurrent relations, as well as implicit and explicit signals which give explainable rationales to our analyses. We survey shortcomings of RST and other existing frameworks, such as Segmented Discourse Representation Theory (SDRT), the Penn Discourse Treebank (PDTB) and Discourse Dependencies, and address these using constructs in the proposed theory. We provide annotation, search and visualization tools for data, and present and evaluate a freely available corpus of English annotated according to our framework, encompassing 12 spoken and written genres with over 200K tokens. Finally, we discuss automatic parsing, evaluation metrics and applications for data in our framework.
arxiv情報
著者 | Amir Zeldes,Tatsuya Aoyama,Yang Janet Liu,Siyao Peng,Debopam Das,Luke Gessler |
発行日 | 2024-03-20 12:52:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google