Personalized Dialogue Generation with Persona-Adaptive Attention

要約

タイトル: パーソナライズされた対話生成におけるパーソナアダプティブアテンション

要約:
– パーソナベースの対話システムは、歴史的文脈と事前定義されたパーソナに基づいて一貫性のある応答を生成することを目的としています。
– 従来の対話生成と異なり、パーソナベースの対話では、対話文脈とパーソナの両方を考慮する必要があり、一貫したトレーニングにおいて課題を提供します。
– そのため、本論文では、パーソナアダプティブアテンション(PAA)を備えた効果的なフレームワークを提案し、パーソナとコンテキスト情報から重みを自動的に統合するよう設計された注意メカニズムを用いて、フレームワークの性能を改善しました。
– さらに、PAAに動的マスキングメカニズムを適用することで、コンテキストとパーソナの冗長な情報を排除し、過学習を回避するための正規化メカニズムとしても機能します。
– 実験結果は、提案されたPAAフレームワークが、自動評価と人間の評価の両方において、強固なベースラインに比べて優れていることを示しています。
– さらに、提案されたPAAアプローチは、フルデータ設定でトレーニングされた大きなモデルと比較して、20%から30%のデータのみを使用して同様の結果を達成する低リソース環境でも同等に良いパフォーマンスを発揮します。
– この設計の有効性を最大限に活用するために、重み付けられた情報を異なる方法で処理するためのいくつかのバリアントを設計し、重み付けやマスキングの設計の必要性と十分性を示しました。

要約(オリジナル)

Persona-based dialogue systems aim to generate consistent responses based on historical context and predefined persona. Unlike conventional dialogue generation, the persona-based dialogue needs to consider both dialogue context and persona, posing a challenge for coherent training. Specifically, this requires a delicate weight balance between context and persona. To achieve that, in this paper, we propose an effective framework with Persona-Adaptive Attention (PAA), which adaptively integrates the weights from the persona and context information via our designed attention. In addition, a dynamic masking mechanism is applied to the PAA to not only drop redundant information in context and persona but also serve as a regularization mechanism to avoid overfitting. Experimental results demonstrate the superiority of the proposed PAA framework compared to the strong baselines in both automatic and human evaluation. Moreover, the proposed PAA approach can perform equivalently well in a low-resource regime compared to models trained in a full-data setting, which achieve a similar result with only 20% to 30% of data compared to the larger models trained in the full-data setting. To fully exploit the effectiveness of our design, we designed several variants for handling the weighted information in different ways, showing the necessity and sufficiency of our weighting and masking designs.

arxiv情報

著者 Qiushi Huang,Yu Zhang,Tom Ko,Xubo Liu,Bo Wu,Wenwu Wang,Lilian Tang
発行日 2023-04-04 12:26:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク