要約
仲間とのコミュニケーションを通じてアイデアを共有することは、人間の対話の主要なモードです。
その結果、会話型 AI の分野で広範な研究が行われ、会話型タスク、データセット、メソッドの可用性と多様性が向上しました。
しかし、多数のタスクが同時に検討されているため、会話型 AI の現在の状況は断片化しています。
したがって、対話エージェント用によく考えられたモデルを開始することは、実践者にとって大きな課題となる可能性があります。
実践者が対話エージェントをゼロから設計するために必要な重要な要素を強調するために、現在の研究では、対話エージェントの主な特性、サポートタスク、それらに対応するオープンドメインデータセット、およびベンチマークに使用される方法の包括的な概要を提供します。
これらのデータセット。
異なる対話タスクに取り組むために、さまざまな方法が使用されていることがわかります。
ただし、タスクごとに個別のモデルを構築するとコストがかかり、対話エージェントの複数のタスク間の相関関係を活用できません。
その結果、最近の傾向は、統合基盤モデルの構築への移行を示唆しています。
この目的を達成するために、我々は、さまざまな対話タスクの既存のデータセットの会話から構築され、それぞれのニュアンスを捉えた統一対話データセットである UNIT を提案します。
また、対話エージェントのパフォーマンスを測定するために使用される評価戦略を検証し、会話型 AI の分野における将来の研究の範囲を強調します。
要約(オリジナル)
Sharing ideas through communication with peers is the primary mode of human interaction. Consequently, extensive research has been conducted in the area of conversational AI, leading to an increase in the availability and diversity of conversational tasks, datasets, and methods. However, with numerous tasks being explored simultaneously, the current landscape of conversational AI becomes fragmented. Therefore, initiating a well-thought-out model for a dialogue agent can pose significant challenges for a practitioner. Towards highlighting the critical ingredients needed for a practitioner to design a dialogue agent from scratch, the current study provides a comprehensive overview of the primary characteristics of a dialogue agent, the supporting tasks, their corresponding open-domain datasets, and the methods used to benchmark these datasets. We observe that different methods have been used to tackle distinct dialogue tasks. However, building separate models for each task is costly and does not leverage the correlation among the several tasks of a dialogue agent. As a result, recent trends suggest a shift towards building unified foundation models. To this end, we propose UNIT, a UNified dIalogue dataseT constructed from conversations of existing datasets for different dialogue tasks capturing the nuances for each of them. We also examine the evaluation strategies used to measure the performance of dialogue agents and highlight the scope for future research in the area of conversational AI.
arxiv情報
著者 | Shivani Kumar,Sumit Bhatia,Milan Aggarwal,Tanmoy Chakraborty |
発行日 | 2024-05-23 13:45:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google