要約
外部の知識を対話生成に組み込むと、有益な応答や様式化された応答の生成、会話のトピックの制御など、オープンドメインの対話システム (DS) のパフォーマンスに利益をもたらすことが証明されています。
この記事では、非構造化テキストを外部知識源として使用するオープンドメイン DS (\textbf{U}nstructed \textbf{T}ext \textbf{E}nhanced \textbf{D}ialogue \textbf{S}ystem) について研究します。
、\textbf{UTEDS})。
非構造化テキストの存在は、UTEDS と従来のデータ駆動型 DS との違いを必然的に伴い、私たちはこれらの違いを分析することを目指しています。
まず UTEDS 関連の概念の定義を示し、次に最近リリースされたデータセットとモデルを要約します。
UTEDSを検索モデルと生成モデルに分類し、モデルコンポーネントの観点から紹介します。
検索モデルは融合、マッチング、ランキングの各モジュールで構成され、生成モデルは対話と知識のエンコーディング、知識の選択、および応答生成のモジュールで構成されます。
さらに、UTEDSで利用されている評価手法を要約し、現行モデルの性能を分析します。
最後に、この分野での新しい研究を刺激することを期待して、UTEDS の将来の開発トレンドについて話し合います。
要約(オリジナル)
Incorporating external knowledge into dialogue generation has been proven to benefit the performance of an open-domain Dialogue System (DS), such as generating informative or stylized responses, controlling conversation topics. In this article, we study the open-domain DS that uses unstructured text as external knowledge sources (\textbf{U}nstructured \textbf{T}ext \textbf{E}nhanced \textbf{D}ialogue \textbf{S}ystem, \textbf{UTEDS}). The existence of unstructured text entails distinctions between UTEDS and traditional data-driven DS and we aim to analyze these differences. We first give the definition of the UTEDS related concepts, then summarize the recently released datasets and models. We categorize UTEDS into Retrieval and Generative models and introduce them from the perspective of model components. The retrieval models consist of Fusion, Matching, and Ranking modules, while the generative models comprise Dialogue and Knowledge Encoding, Knowledge Selection, and Response Generation modules. We further summarize the evaluation methods utilized in UTEDS and analyze the current models’ performance. At last, we discuss the future development trends of UTEDS, hoping to inspire new research in this field.
arxiv情報
著者 | Longxuan Ma,Mingda Li,Weinan Zhang,Jiapeng Li,Ting Liu |
発行日 | 2024-11-14 03:54:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google