RST-style Discourse Parsing Guided by Document-level Content Structures

要約

修辞構造理論に基づく談話解析 (RST-DP) は、節、文、および大きなテキスト スパンが談話全体をどのように構成するかを調査し、修辞構造を階層ツリーとして提示します。
既存の RST 解析パイプラインは、文書レベルの内容構造を認識せずに修辞構造を構築するため、大きなテキスト範囲の談話関係を予測する際のパフォーマンスが比較的低下します。
談話関係の認識を促進する上での高レベルのコンテンツ関連情報の価値を認識し、ニュース談話プロファイリングのタスクから派生した構造を認識したニュースコンテンツ文表現を組み込んだ RST-DP の新しいパイプラインを提案します。
この強化されたパイプラインは、いくつかの追加レイヤーを組み込むだけで、さまざまな RST 解析メトリックにわたって有望なパフォーマンスを示します。

要約(オリジナル)

Rhetorical Structure Theory based Discourse Parsing (RST-DP) explores how clauses, sentences, and large text spans compose a whole discourse and presents the rhetorical structure as a hierarchical tree. Existing RST parsing pipelines construct rhetorical structures without the knowledge of document-level content structures, which causes relatively low performance when predicting the discourse relations for large text spans. Recognizing the value of high-level content-related information in facilitating discourse relation recognition, we propose a novel pipeline for RST-DP that incorporates structure-aware news content sentence representations derived from the task of News Discourse Profiling. By incorporating only a few additional layers, this enhanced pipeline exhibits promising performance across various RST parsing metrics.

arxiv情報

著者 Ming Li,Ruihong Huang
発行日 2023-09-08 05:50:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク