Improving Conversational Recommendation Systems via Counterfactual Data Simulation

要約

会話型レコメンダー システム (CRS) は、自然言語の会話を通じてレコメンデーション サービスを提供することを目的としています。
有能な CRS を開発するために多くのアプローチが提案されていますが、それらは通常、トレーニングに十分なトレーニング データに依存しています。
レコメンデーション指向の対話データセットに注釈を付けるのは難しいため、既存の CRS アプローチでは、トレーニング データの不足によりトレーニングが不十分になるという問題が発生することがよくあります。
この問題に対処するために、この論文では、CRS におけるデータ不足の問題を軽減するために、CFCRS と呼ばれる CRS 用の CounterFactual データ シミュレーション アプローチを提案します。
私たちのアプローチは、反事実データ拡張のフレームワークに基づいて開発されており、会話全体の流れを妨げることなく、実際の対話からユーザーの好みへの書き換えを徐々に組み込んでいます。
アプローチを開発するために、ユーザーの好みを特徴付け、対話に関与するエンティティごとに会話フローを整理し、会話フロー言語モデルに基づいて多段階の推奨対話シミュレーターを設計します。
学習されたユーザーの好みと対話スキーマの指導の下で、フロー言語モデルは合理的で一貫した会話フローを生成でき、さらに完全な対話を実現できます。
シミュレータに基づいて、ターゲットユーザーの対話対象エンティティの表現で介入を実行し、データ拡張戦略を段階的に最適化できるカリキュラムスケジュールを備えた敵対的トレーニング方法を設計します。
広範な実験により、特にトレーニング データが限られている場合、私たちのアプローチがいくつかの競合する CRS のパフォーマンスを一貫して向上させ、他のデータ拡張手法を上回るパフォーマンスを発揮できることが示されています。
私たちのコードは https://github.com/RUCAIBox/CFCRS で公開されています。

要約(オリジナル)

Conversational recommender systems (CRSs) aim to provide recommendation services via natural language conversations. Although a number of approaches have been proposed for developing capable CRSs, they typically rely on sufficient training data for training. Since it is difficult to annotate recommendation-oriented dialogue datasets, existing CRS approaches often suffer from the issue of insufficient training due to the scarcity of training data. To address this issue, in this paper, we propose a CounterFactual data simulation approach for CRS, named CFCRS, to alleviate the issue of data scarcity in CRSs. Our approach is developed based on the framework of counterfactual data augmentation, which gradually incorporates the rewriting to the user preference from a real dialogue without interfering with the entire conversation flow. To develop our approach, we characterize user preference and organize the conversation flow by the entities involved in the dialogue, and design a multi-stage recommendation dialogue simulator based on a conversation flow language model. Under the guidance of the learned user preference and dialogue schema, the flow language model can produce reasonable, coherent conversation flows, which can be further realized into complete dialogues. Based on the simulator, we perform the intervention at the representations of the interacted entities of target users, and design an adversarial training method with a curriculum schedule that can gradually optimize the data augmentation strategy. Extensive experiments show that our approach can consistently boost the performance of several competitive CRSs, and outperform other data augmentation methods, especially when the training data is limited. Our code is publicly available at https://github.com/RUCAIBox/CFCRS.

arxiv情報

著者 Xiaolei Wang,Kun Zhou,Xinyu Tang,Wayne Xin Zhao,Fan Pan,Zhao Cao,Ji-Rong Wen
発行日 2023-06-05 12:48:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク