Topic Shift Detection in Chinese Dialogues: Corpus and Benchmark




– 対話における話題変化検出は、応答が既知か未知かに分類される
– 応答が未知の場合でも話題変化を予測することは課題
– 中国語自然会話トピック・ダイアログ(CNTD)コーパスを注釈して、中国語自然会話トピックコーパスの空白を埋めた
– 階層的対比学習に基づく教師生徒フレームワークで応答なしで話題変化を予測する手法を提案した
– 高レベルの教師生徒に応答を導入して、応答と文脈の間の対比学習を構築し、低レベルの生徒にはラベル対比学習を構築する手法とした
– 提案されたモデルの有効性が、中国語CNTDと英語TIAGEの実験において示された。


Dialogue topic shift detection is to detect whether an ongoing topic has shifted or should shift in a dialogue, which can be divided into two categories, i.e., response-known task and response-unknown task. Currently, only a few investigated the latter, because it is still a challenge to predict the topic shift without the response information. In this paper, we first annotate a Chinese Natural Topic Dialogue (CNTD) corpus consisting of 1308 dialogues to fill the gap in the Chinese natural conversation topic corpus. And then we focus on the response-unknown task and propose a teacher-student framework based on hierarchical contrastive learning to predict the topic shift without the response. Specifically, the response at high-level teacher-student is introduced to build the contrastive learning between the response and the context, while the label contrastive learning is constructed at low-level student. The experimental results on our Chinese CNTD and English TIAGE show the effectiveness of our proposed model.


著者 Jiangyi Lin,Yaxin Fan,Feng Jiang,Xiaomin Chu,Peifeng Li
発行日 2023-05-02 04:03:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CL, cs.LG パーマリンク