DialogRE^C+: An Extension of DialogRE to Investigate How Much Coreference Helps Relation Extraction in Dialogs

要約

対話テキスト内の議論のペア間の関係を識別する対話関係抽出 (DRE) は、人称代名詞、または実体と話者の共参照が頻繁に発生するため、大きな問題を抱えています。
この作業では、新しいベンチマーク データセット DialogRE^C+ が導入され、DRE シナリオに共参照解決が導入されます。
質の高い共参照知識の助けにより、議論関係の推論が強化されることが期待されます。
DialogRE^C+ データセットでは、既存の DialogRE データに基づいて、36,369 件の引数の言及にわたる合計 5,068 の共参照チェーンに手動で注釈を付けます。ここでは、4 つの異なる共参照チェーン タイプ、つまり話者チェーン、人物チェーン、場所チェーン、および組織チェーンが明示的にマークされています。
さらに、DRE タスクを改善するための効果的な共参照表現を学習する 4 つの共参照強化グラフベース DRE モデルを開発します。
また、アノテーションに基づいて共参照解決モデルをトレーニングし、自動的に抽出された共参照チェーンの効果を評価して、データセットの実用性と他のドメインやタスクに対するその可能性を示します。

要約(オリジナル)

Dialogue relation extraction (DRE) that identifies the relations between argument pairs in dialogue text, suffers much from the frequent occurrence of personal pronouns, or entity and speaker coreference. This work introduces a new benchmark dataset DialogRE^C+, introducing coreference resolution into the DRE scenario. With the aid of high-quality coreference knowledge, the reasoning of argument relations is expected to be enhanced. In DialogRE^C+ dataset, we manually annotate total 5,068 coreference chains over 36,369 argument mentions based on the existing DialogRE data, where four different coreference chain types namely speaker chain, person chain, location chain and organization chain are explicitly marked. We further develop 4 coreference-enhanced graph-based DRE models, which learn effective coreference representations for improving the DRE task. We also train a coreference resolution model based on our annotations and evaluate the effect of automatically extracted coreference chains demonstrating the practicality of our dataset and its potential to other domains and tasks.

arxiv情報

著者 Yiyun Xiong,Mengwei Dai,Fei Li,Hao Fei,Bobo Li,Shengqiong Wu,Donghong Ji,Chong Teng
発行日 2023-08-08 18:03:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク