Topic Shift Detection in Chinese Dialogues: Corpus and Benchmark

要約

【タイトル】中国語の対話における話題変化の検出:コーパスとベンチマーク

【要約】
・話題変化検出とは、対話において進行中の話題が変化したか、または変化すべきかを検出するもので、応答が既知の場合と応答が未知の場合に分けられる。
・現在は、応答情報がない状態でも話題変化を予測するのはまだ課題であるため、前者が多く研究されている。
・本論文では、中国語自然会話トピック・ダイアログ(CNTD)コーパス1308件を注釈し、中国語自然会話トピックコーパスの空白を埋めた。そして、応答が未知のタスクに焦点を当て、階層的対比学習に基づく教師生徒フレームワークを提案し、応答なしで話題変化を予測する。
・具体的には、高レベルの教師生徒に応答を導入して、応答と文脈の間の対比学習を構築し、低レベルの生徒にはラベル対比学習を構築する。
・中国語CNTDと英語TIAGEにおける実験結果から、提案されたモデルの効果が示された。

【要点】
– 対話における話題変化検出は、応答が既知か未知かに分類される
– 応答が未知の場合でも話題変化を予測することは課題
– 中国語自然会話トピック・ダイアログ(CNTD)コーパスを注釈して、中国語自然会話トピックコーパスの空白を埋めた
– 階層的対比学習に基づく教師生徒フレームワークで応答なしで話題変化を予測する手法を提案した
– 高レベルの教師生徒に応答を導入して、応答と文脈の間の対比学習を構築し、低レベルの生徒にはラベル対比学習を構築する手法とした
– 提案されたモデルの有効性が、中国語CNTDと英語TIAGEの実験において示された。

要約(オリジナル)

Dialogue topic shift detection is to detect whether an ongoing topic has shifted or should shift in a dialogue, which can be divided into two categories, i.e., response-known task and response-unknown task. Currently, only a few investigated the latter, because it is still a challenge to predict the topic shift without the response information. In this paper, we first annotate a Chinese Natural Topic Dialogue (CNTD) corpus consisting of 1308 dialogues to fill the gap in the Chinese natural conversation topic corpus. And then we focus on the response-unknown task and propose a teacher-student framework based on hierarchical contrastive learning to predict the topic shift without the response. Specifically, the response at high-level teacher-student is introduced to build the contrastive learning between the response and the context, while the label contrastive learning is constructed at low-level student. The experimental results on our Chinese CNTD and English TIAGE show the effectiveness of our proposed model.

arxiv情報

著者 Jiangyi Lin,Yaxin Fan,Feng Jiang,Xiaomin Chu,Peifeng Li
発行日 2023-05-02 04:03:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.LG パーマリンク