人間とオープンドメインで深く魅力的な会話ができるソーシャルボットを構築することは、人工知能 (AI) の大きな課題の 1 つです。
オープンドメインの会話型 AI のさらなる研究を支援するために、基礎となる知識が 8 つの広範なトピックにまたがり、会話パートナーには明確に定義された役割がない、知識に基づいた人間間の会話データセットである Topical-Chat を紹介します。
また、Topical-Chat 上でいくつかの最先端のエンコーダ/デコーダ会話モデルをトレーニングし、ベンチマークのための自動評価と人間による評価を実行します。
Building socialbots that can have deep, engaging open-domain conversations with humans is one of the grand challenges of artificial intelligence (AI). To this end, bots need to be able to leverage world knowledge spanning several domains effectively when conversing with humans who have their own world knowledge. Existing knowledge-grounded conversation datasets are primarily stylized with explicit roles for conversation partners. These datasets also do not explore depth or breadth of topical coverage with transitions in conversations. We introduce Topical-Chat, a knowledge-grounded human-human conversation dataset where the underlying knowledge spans 8 broad topics and conversation partners don’t have explicitly defined roles, to help further research in open-domain conversational AI. We also train several state-of-the-art encoder-decoder conversational models on Topical-Chat and perform automated and human evaluation for benchmarking.
著者 | Karthik Gopalakrishnan,Behnam Hedayatnia,Qinlang Chen,Anna Gottardi,Sanjeev Kwatra,Anu Venkatesh,Raefer Gabriel,Dilek Hakkani-Tur |
発行日 | 2023-08-23 08:33:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google