‘Wait, did you mean the doctor?’: Collecting a Dialogue Corpus for Topical Analysis

要約

対話は人間の行動の核心であり、会話に参加するには、目の前のトピックを特定できることが重要です。
しかし、カジュアルな対話における話題の構成や、文献の中で人々が現在の話題をどのように認識しているかについての説明はほとんどありません。
さらに、対話内のトピックを分析するには、いくつかのトピックやトピックの変化の種類を含むのに十分な長さの会話が必要です。
このようなデータの収集と注釈付けは複雑です。
本稿では、話題分析に適したコーパスを構築することを目的とした対話収集実験を紹介する。
収集は弊社が開発したメッセージングツールを用いて実施いたします。

要約(オリジナル)

Dialogue is at the core of human behaviour and being able to identify the topic at hand is crucial to take part in conversation. Yet, there are few accounts of the topical organisation in casual dialogue and of how people recognise the current topic in the literature. Moreover, analysing topics in dialogue requires conversations long enough to contain several topics and types of topic shifts. Such data is complicated to collect and annotate. In this paper we present a dialogue collection experiment which aims to build a corpus suitable for topical analysis. We will carry out the collection with a messaging tool we developed.

arxiv情報

著者 Amandine Decker,Vincent Tourneur,Maxime Amblard,Ellen Breitholtz
発行日 2025-01-14 09:00:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク