Automatic Alignment of Discourse Relations of Different Discourse Annotation Frameworks

要約

既存の談話コーパスはさまざまなフレームワークに基づいて注釈が付けられており、議論と関係、および構造的制約の定義に重大な相違があることが示されています。
表面的な違いにもかかわらず、これらの枠組みは談話関係の基本的な理解を共有しています。
これらのフレームワーク間の関係、特に異なるフレームワークで利用される関係目録間の相関関係は未解決の研究課題となっています。
この疑問をより深く理解することは、談話理論を統合し、異なる枠組みの下で注釈が付けられた談話コーパスの相互運用性を可能にするのに役立ちます。
ただし、談話関係目録間の相関関係を調査する研究は、談話分割のさまざまな基準によって妨げられ、通常は専門知識と手作業による検査が必要です。
いくつかの半自動手法が提案されていますが、それらは複数のフレームワークで並行して注釈が付けられたコーパスに依存しています。
このペーパーでは、この課題に対処するための完全に自動化されたアプローチを紹介します。
具体的には、Zhang et al. によって導入されたラベルアンカー型対比学習法を拡張します。
(2022b) 分類タスク中にラベルの埋め込みを学習します。
これらの埋め込みは、さまざまなフレームワークからの談話関係をマッピングするために利用されます。
RST-DT (Carlson et al., 2001) および PDTB 3.0 (Prasad et al., 2018) に関する実験結果を示します。

要約(オリジナル)

Existing discourse corpora are annotated based on different frameworks, which show significant dissimilarities in definitions of arguments and relations and structural constraints. Despite surface differences, these frameworks share basic understandings of discourse relations. The relationship between these frameworks has been an open research question, especially the correlation between relation inventories utilized in different frameworks. Better understanding of this question is helpful for integrating discourse theories and enabling interoperability of discourse corpora annotated under different frameworks. However, studies that explore correlations between discourse relation inventories are hindered by different criteria of discourse segmentation, and expert knowledge and manual examination are typically needed. Some semi-automatic methods have been proposed, but they rely on corpora annotated in multiple frameworks in parallel. In this paper, we introduce a fully automatic approach to address the challenges. Specifically, we extend the label-anchored contrastive learning method introduced by Zhang et al. (2022b) to learn label embeddings during a classification task. These embeddings are then utilized to map discourse relations from different frameworks. We show experimental results on RST-DT (Carlson et al., 2001) and PDTB 3.0 (Prasad et al., 2018).

arxiv情報

著者 Yingxue Fu
発行日 2024-03-29 14:18:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク