TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods

要約

著者名難読化は、文体、語彙、構文、およびテキストの作成者に関連するその他の言語的特徴を変更することによって、テキスト内の作成者の身元を隠すことを目的としています。
この変更では、プライバシーと実用性のバランスを取る必要があります。
強力な難読化技術は、作成者の身元を効果的に隠すことができますが、意図した目的に対するテキストの品質と有用性を低下させることがよくあります。
逆に、高い有用性を維持するとプライバシーが不十分になる傾向があり、攻撃者が作成者の匿名化を解除することが容易になります。
したがって、これら 2 つの相反する目的の間で最適なトレードオフを達成することが重要です。
この論文では、TAROT: Task-Oriented Authorship Obfuscation using Policy Optimization を提案します。これは、下流のユーティリティを考慮してテキスト全体を再生成することで、プライバシーとユーティリティのトレードオフを最適化することを目的とした、新しい教師なしの著者シップ難読化手法です。
私たちのアプローチは、著者のアイデンティティと下流のタスクユーティリティを維持することによってテキストを書き換えるために、小さな言語モデルの微調整パラダイムとしてポリシーの最適化を活用します。
私たちのアプローチは、実用性を維持しながら攻撃者の精度を大幅に低下させることを示します。
私たちはコードとモデルを公開しています。

要約(オリジナル)

Authorship obfuscation aims to disguise the identity of an author within a text by altering the writing style, vocabulary, syntax, and other linguistic features associated with the text author. This alteration needs to balance privacy and utility. While strong obfuscation techniques can effectively hide the author’s identity, they often degrade the quality and usefulness of the text for its intended purpose. Conversely, maintaining high utility tends to provide insufficient privacy, making it easier for an adversary to de-anonymize the author. Thus, achieving an optimal trade-off between these two conflicting objectives is crucial. In this paper, we propose TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization, a new unsupervised authorship obfuscation method whose goal is to optimize the privacy-utility trade-off by regenerating the entire text considering its downstream utility. Our approach leverages policy optimization as a fine-tuning paradigm over small language models in order to rewrite texts by preserving author identity and downstream task utility. We show that our approach largely reduce the accuracy of attackers while preserving utility. We make our code and models publicly available.

arxiv情報

著者 Gabriel Loiseau,Damien Sileo,Damien Riquet,Maxime Meyer,Marc Tommasi
発行日 2024-07-31 14:24:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク