AUGUST: an Automatic Generation Understudy for Synthesizing Conversational Recommendation Datasets

要約

高品質のデータは会話型レコメンデーション システムに不可欠であり、ネットワーク アーキテクチャの開発とトレーニング戦略設計の基礎として機能します。
既存の作業では、手動でラベルを付けたり、レコメンダーダイアログテンプレートを設計および拡張したりするという多大な労力が費やされています。
しかし、彼らは、(i) ヒューマン アノテーターの数が限られているため、データセットでは現実世界の豊富で大規模なケースをほとんどキャプチャできない、(ii) アノテーターの経験と知識が限られているため、情報量の少ないコーパスや不適切な推奨事項が発生する、という問題に悩まされています。

この論文では、実世界のユーザーアイテム情報に基づいて構造化グラフから非構造化レコメンデーション会話を生成するdata2text生成プロセスを通じて、大規模かつ高品質なレコメンドダイアログを生成できる新しいデータセット自動合成アプローチを提案します。

その際、当社は、(i) 従来のレコメンデーション データセットからの豊富なパーソナライズされたユーザー プロファイル、(ii) ナレッジ グラフからの豊富な外部知識、および (iii) 人間同士の会話によるレコメンデーション データセットに含まれる会話能力を包括的に活用します。
広範な実験により、リソースが少ないシナリオで自動的に合成されたデータによってもたらされる利点が検証され、より効果的な会話型レコメンデーション システムの開発を促進する有望な可能性が実証されています。

要約(オリジナル)

High-quality data is essential for conversational recommendation systems and serves as the cornerstone of the network architecture development and training strategy design. Existing works contribute heavy human efforts to manually labeling or designing and extending recommender dialogue templates. However, they suffer from (i) the limited number of human annotators results in that datasets can hardly capture rich and large-scale cases in the real world, (ii) the limited experience and knowledge of annotators account for the uninformative corpus and inappropriate recommendations. In this paper, we propose a novel automatic dataset synthesis approach that can generate both large-scale and high-quality recommendation dialogues through a data2text generation process, where unstructured recommendation conversations are generated from structured graphs based on user-item information from the real world. In doing so, we comprehensively exploit: (i) rich personalized user profiles from traditional recommendation datasets, (ii) rich external knowledge from knowledge graphs, and (iii) the conversation ability contained in human-to-human conversational recommendation datasets. Extensive experiments validate the benefit brought by the automatically synthesized data under low-resource scenarios and demonstrate the promising potential to facilitate the development of a more effective conversational recommendation system.

arxiv情報

著者 Yu Lu,Junwei Bao,Zichen Ma,Xiaoguang Han,Youzheng Wu,Shuguang Cui,Xiaodong He
発行日 2023-06-16 05:27:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク