The distribution of discourse relations within and across turns in spontaneous conversation

要約

時間のプレッシャーとトピックの交渉により、人々が自発的な会話の文脈で談話関係 (DR) を活用する方法に制約が課される可能性があります。
この研究では、初心者のアノテーターからのクラウドソースのアノテーションを使用して、書き言葉の DR システムを自発的な対話に適応させます。
次に、談話関係が複数のタイプの複数発話コンテキスト間で異なって使用されるかどうかをテストします。
DR アノテーションのパターンを話者内と話者間、およびターン内と話者間で比較します。
最終的に、異なる談話文脈は談話関係の異なる分布を生み出し、シングルターンアノテーションがアノテーターにとって最も不確実性を生み出すことがわかりました。
さらに、談話関係の注釈は談話単位の埋め込みから予測するのに十分な品質であることがわかります。

要約(オリジナル)

Time pressure and topic negotiation may impose constraints on how people leverage discourse relations (DRs) in spontaneous conversational contexts. In this work, we adapt a system of DRs for written language to spontaneous dialogue using crowdsourced annotations from novice annotators. We then test whether discourse relations are used differently across several types of multi-utterance contexts. We compare the patterns of DR annotation within and across speakers and within and across turns. Ultimately, we find that different discourse contexts produce distinct distributions of discourse relations, with single-turn annotations creating the most uncertainty for annotators. Additionally, we find that the discourse relation annotations are of sufficient quality to predict from embeddings of discourse units.

arxiv情報

著者 S. Magalí López Cortez,Cassandra L. Jacobs
発行日 2023-07-07 15:06:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク