PersonaMark: Personalized LLM watermarking for model protection and user attribution


カスタマイズされたラージ言語モデル (LLM) の急速な進歩により、かなりの利便性が提供されます。
プライベート LLM の広範な採用により、モデルの著作権を保護し、データのプライバシーを確​​保することが重要になっています。
テキスト透かしは、AI によって生成されたコンテンツを検出し、モデルを保護するための実行可能なソリューションとして浮上しました。
このペーパーでは、LLM の著作権を保護し、説明責任を強化するために設計された、新しいパーソナライズされたテキスト透かしスキームである PersonaMark を紹介します。
このアプローチは時間効率が高く、スケーラブルであり、マルチユーザー ハッシュ メカニズムを通じて多数のユーザーを処理できます。
私たちの知る限り、これは LLM におけるパーソナライズされた透かしを探求する先駆的な研究です。
私たちは 4 つの LLM にわたって広範な評価を実施し、複雑さ、センチメント、整合性、可読性などのさまざまな指標を分析します。


The rapid advancement of customized Large Language Models (LLMs) offers considerable convenience. However, it also intensifies concerns regarding the protection of copyright/confidential information. With the extensive adoption of private LLMs, safeguarding model copyright and ensuring data privacy have become critical. Text watermarking has emerged as a viable solution for detecting AI-generated content and protecting models. However, existing methods fall short in providing individualized watermarks for each user, a critical feature for enhancing accountability and traceability. In this paper, we introduce PersonaMark, a novel personalized text watermarking scheme designed to protect LLMs’ copyrights and bolster accountability. PersonaMark leverages sentence structure as a subtle carrier of watermark information and optimizes the generation process to maintain the natural output of the model. By employing a personalized hashing function, unique watermarks are embedded for each user, enabling high-quality text generation without compromising the model’s performance. This approach is both time-efficient and scalable, capable of handling large numbers of users through a multi-user hashing mechanism. To the best of our knowledge, this is a pioneer study to explore personalized watermarking in LLMs. We conduct extensive evaluations across four LLMs, analyzing various metrics such as perplexity, sentiment, alignment, and readability. The results validate that PersonaMark preserves text quality, ensures unbiased watermark insertion, and offers robust watermark detection capabilities, all while maintaining the model’s behavior with minimal disruption.


著者 Yuehan Zhang,Peizhuo Lv,Yinpeng Liu,Yongqiang Ma,Wei Lu,Xiaofeng Wang,Xiaozhong Liu,Jiawei Liu
発行日 2024-12-17 16:52:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL, cs.CR パーマリンク