要約
近年の機械学習とディープラーニングの進歩により、多くの実用的なアプリケーションで会話AIが広く使用されるようになった。しかし、会話の文脈やパーソナライズされたチューニングを提供する補助情報を活用して会話の質を向上させることは、まだ非常に困難である。例えば、会話の質を向上させるために個人のペルソナ情報を利用する研究は限られており、最先端の会話AI技術でさえ、マルチモーダルインタラクションデータ、デモグラフィック、SDOHデータなどの補助データの異種ソースからの信号を効果的に活用することはできない。本論文では、会話の応答生成の質を向上させるために、マルチストリームエンコーディング方式でペルソナ情報を活用する、新しいペルソナ符号化ポリエンコーダ手法を提示する。提案手法の有効性を示すため、2つの異なるペルソナベースの会話データセットで本手法を評価し、2つの最新手法と比較した。その結果、提案手法はベースライン手法であるPoly-Encoderと比較して、BLEUスコアで3.32%、HR@1で2.94%会話品質を向上させることができた。さらに重要なことは、本手法は会話タスクにおけるマルチモーダルデータのより良い利用への道を提供することである。最後に、本研究は、パーソナライズされた会話AI技術を発展させるためのいくつかの課題と将来の研究の方向性を概説する。
要約(オリジナル)
Recent advances in machine learning and deep learning have led to the widespread use of Conversational AI in many practical applications. However, it is still very challenging to leverage auxiliary information that can provide conversational context or personalized tuning to improve the quality of conversations. For example, there has only been limited research on using an individuals persona information to improve conversation quality, and even state-of-the-art conversational AI techniques are unable to effectively leverage signals from heterogeneous sources of auxiliary data, such as multi-modal interaction data, demographics, SDOH data, etc. In this paper, we present a novel Persona-Coded Poly-Encoder method that leverages persona information in a multi-stream encoding scheme to improve the quality of response generation for conversations. To show the efficacy of the proposed method, we evaluate our method on two different persona-based conversational datasets, and compared against two state-of-the-art methods. Our experimental results and analysis demonstrate that our method can improve conversation quality over the baseline method Poly-Encoder by 3.32% and 2.94% in terms of BLEU score and HR@1, respectively. More significantly, our method offers a path to better utilization of multi-modal data in conversational tasks. Lastly, our study outlines several challenges and future research directions for advancing personalized conversational AI technology.
arxiv情報
著者 | Junfeng Liu,Christopher Symons,Ranga Raju Vatsavai |
発行日 | 2023-12-01 18:45:12+00:00 |
arxivサイト | arxiv_id(pdf) |