Don’t lose the message while paraphrasing: A study on content preserving style transfer

要約

テキスト スタイル転送技術は、自然言語処理で人気が高まっています。これにより、テキストを必要な形式に言い換えることができます。有毒な言語からニューラルな言語へ、形式的な英語から非公式な言語へ、古い英語から現代の英語へなどです。タスクを解決するだけでは、ニューラルな言語やニューラルな言語を生成するには十分ではありません。
非公式/現代文ですが、元の内容を変更せずに保存することが重要です。
この要件は、元のメッセージを保存するために事実情報を保持しなければならない目標指向の対話のスタイル転送など、一部のアプリケーションではさらに重要になります。
特定の種類のピザを特定の時間に特定の住所に注文する。
コンテンツの保存という側面は、スタイル伝達研究を実際に応用する場合に重要ですが、あまり注目されていません。
このギャップを埋めるために、形式伝達ドメインの例でさまざまなスタイル伝達モデルの比較を実行します。
さまざまなスタイル転送方法のコンテンツ保存能力の研究を実行するために、公式対非公式のタスク指向の対話の並列データセットを作成します。
私たちのデータセットと GYAFC [17] のような既存のデータセットとの主な違いは、言い換え中に保持する必要がある事前定義されたセマンティック スロットを備えた目標指向の対話が存在することです。
名前付きエンティティ。
この追加の注釈により、スタイル転送のためのいくつかの最先端技術の正確な比較研究を行うことができました。
私たちの研究のもう 1 つの結果は、教師なしメソッド LEWIS [19] の修正であり、元のメソッドおよび提案されたタスクのすべての評価ベースラインに比べて大幅な改善が得られます。

要約(オリジナル)

Text style transfer techniques are gaining popularity in natural language processing allowing paraphrasing text in the required form: from toxic to neural, from formal to informal, from old to the modern English language, etc. Solving the task is not sufficient to generate some neural/informal/modern text, but it is important to preserve the original content unchanged. This requirement becomes even more critical in some applications such as style transfer of goal-oriented dialogues where the factual information shall be kept to preserve the original message, e.g. ordering a certain type of pizza to a certain address at a certain time. The aspect of content preservation is critical for real-world applications of style transfer studies, but it has received little attention. To bridge this gap we perform a comparison of various style transfer models on the example of the formality transfer domain. To perform a study of the content preservation abilities of various style transfer methods we create a parallel dataset of formal vs. informal task-oriented dialogues. The key difference between our dataset and the existing ones like GYAFC [17] is the presence of goal-oriented dialogues with predefined semantic slots essential to be kept during paraphrasing, e.g. named entities. This additional annotation allowed us to conduct a precise comparative study of several state-of-the-art techniques for style transfer. Another result of our study is a modification of the unsupervised method LEWIS [19] which yields a substantial improvement over the original method and all evaluated baselines on the proposed task.

arxiv情報

著者 Nikolay Babakov,David Dale,Ilya Gusev,Irina Krotova,Alexander Panchenko
発行日 2023-08-17 15:41:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク