要約
人間とオープンドメインで深く魅力的な会話ができるソーシャルボットを構築することは、人工知能 (AI) の大きな課題の 1 つです。
この目的を達成するために、ボットは、独自の世界知識を持つ人間と会話するときに、複数のドメインにまたがる世界知識を効果的に活用できる必要があります。
既存の知識に基づいた会話データセットは、主に会話パートナーの明示的な役割で様式化されています。
また、これらのデータセットは、会話の変遷を伴う話題の範囲の深さや広さを調査するものではありません。
オープンドメインの会話型 AI のさらなる研究を支援するために、基礎となる知識が 8 つの広範なトピックにまたがり、会話パートナーには明確に定義された役割がない、知識に基づいた人間間の会話データセットである Topical-Chat を紹介します。
また、Topical-Chat 上でいくつかの最先端のエンコーダ/デコーダ会話モデルをトレーニングし、ベンチマークのための自動評価と人間による評価を実行します。
要約(オリジナル)
Building socialbots that can have deep, engaging open-domain conversations with humans is one of the grand challenges of artificial intelligence (AI). To this end, bots need to be able to leverage world knowledge spanning several domains effectively when conversing with humans who have their own world knowledge. Existing knowledge-grounded conversation datasets are primarily stylized with explicit roles for conversation partners. These datasets also do not explore depth or breadth of topical coverage with transitions in conversations. We introduce Topical-Chat, a knowledge-grounded human-human conversation dataset where the underlying knowledge spans 8 broad topics and conversation partners don’t have explicitly defined roles, to help further research in open-domain conversational AI. We also train several state-of-the-art encoder-decoder conversational models on Topical-Chat and perform automated and human evaluation for benchmarking.
arxiv情報
著者 | Karthik Gopalakrishnan,Behnam Hedayatnia,Qinlang Chen,Anna Gottardi,Sanjeev Kwatra,Anu Venkatesh,Raefer Gabriel,Dilek Hakkani-Tur |
発行日 | 2023-08-23 08:33:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google