Low-Resource Authorship Style Transfer: Can Non-Famous Authors Be Imitated?


STRAP のような既存の教師なしアプローチは、主に、書籍、講演、その他の出版作品における執筆スタイルの多くの例を用いて、対象となる著者にスタイルを伝達することに重点を置いています。
この高リソースのトレーニング データ要件 (多くの場合 100,000 ワードを超える) により、これらのアプローチは主に、出版された著者、政治家、その他の有名な人物や著者スタイルへのスタイルの移転に役立ちますが、有名でない著者へのスタイルの移転は十分ではありませんでした。
\textit{低リソースの著者スタイル転送} タスクを導入します。これは、対象となる著者のスタイルのテキストが限られた量しか存在しない、より困難なクラスの著者スタイル転送です。
私たちの実験では、特に Reddit からソースとターゲットの著者を選択し、その Reddit 投稿のスタイルを転送し、ターゲットの著者のスタイルの投稿を 16 件 (平均約 500 ワード) に制限しました。


Authorship style transfer involves altering text to match the style of a target author whilst preserving the original meaning. Existing unsupervised approaches like STRAP have largely focused on style transfer to target authors with many examples of their writing style in books, speeches, or other published works. This high-resource training data requirement (often greater than 100,000 words) makes these approaches primarily useful for style transfer to published authors, politicians, or other well-known figures and authorship styles, while style transfer to non-famous authors has not been well-studied. We introduce the \textit{low-resource authorship style transfer} task, a more challenging class of authorship style transfer where only a limited amount of text in the target author’s style may exist. In our experiments, we specifically choose source and target authors from Reddit and style transfer their Reddit posts, limiting ourselves to just 16 posts (on average ~500 words) of the target author’s style. Style transfer accuracy is typically measured by how often a classifier or human judge will classify an output as written by the target author. Recent authorship representations models excel at authorship identification even with just a few writing samples, making automatic evaluation of this task possible for the first time through evaluation metrics we propose. Our results establish an in-context learning technique we develop as the strongest baseline, though we find current approaches do not yet achieve mastery of this challenging task. We release our data and implementations to encourage further investigation.


著者 Ajay Patel,Nicholas Andrews,Chris Callison-Burch
発行日 2023-08-23 16:31:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク