Don’t lose the message while paraphrasing: A study on content preserving style transfer


テキスト スタイル転送技術は、自然言語処理で人気が高まっています。これにより、テキストを必要な形式に言い換えることができます。有毒な言語からニューラルな言語へ、形式的な英語から非公式な言語へ、古い英語から現代の英語へなどです。タスクを解決するだけでは、ニューラルな言語やニューラルな言語を生成するには十分ではありません。
私たちのデータセットと GYAFC [17] のような既存のデータセットとの主な違いは、言い換え中に保持する必要がある事前定義されたセマンティック スロットを備えた目標指向の対話が存在することです。
私たちの研究のもう 1 つの結果は、教師なしメソッド LEWIS [19] の修正であり、元のメソッドおよび提案されたタスクのすべての評価ベースラインに比べて大幅な改善が得られます。


Text style transfer techniques are gaining popularity in natural language processing allowing paraphrasing text in the required form: from toxic to neural, from formal to informal, from old to the modern English language, etc. Solving the task is not sufficient to generate some neural/informal/modern text, but it is important to preserve the original content unchanged. This requirement becomes even more critical in some applications such as style transfer of goal-oriented dialogues where the factual information shall be kept to preserve the original message, e.g. ordering a certain type of pizza to a certain address at a certain time. The aspect of content preservation is critical for real-world applications of style transfer studies, but it has received little attention. To bridge this gap we perform a comparison of various style transfer models on the example of the formality transfer domain. To perform a study of the content preservation abilities of various style transfer methods we create a parallel dataset of formal vs. informal task-oriented dialogues. The key difference between our dataset and the existing ones like GYAFC [17] is the presence of goal-oriented dialogues with predefined semantic slots essential to be kept during paraphrasing, e.g. named entities. This additional annotation allowed us to conduct a precise comparative study of several state-of-the-art techniques for style transfer. Another result of our study is a modification of the unsupervised method LEWIS [19] which yields a substantial improvement over the original method and all evaluated baselines on the proposed task.


著者 Nikolay Babakov,David Dale,Ilya Gusev,Irina Krotova,Alexander Panchenko
発行日 2023-08-17 15:41:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク