Efficiently Identifying Watermarked Segments in Mixed-Source Texts

要約

大規模言語モデル(LLM)内のテキスト透かしは、フェイクニュースや学術的不正行為のような悪用ケースを軽減し、合成テキストを検出するためにますます使用されるようになってきている。既存の電子透かし検出技術は、主に文書全体を電子透かし入りかどうか分類することに重点を置いているが、より長い、混合ソースの文書内の個々の電子透かしセグメントを識別するという一般的なシナリオを無視することが多い。剽窃検出システムからヒントを得て、我々は部分的な透かし検出のための2つの新しい手法を提案する。第一に、長いテキスト中に透かしセグメントがあるかどうかを判定することを目的とした、ジオメトリカバー検出フレームワークを開発する。第二に、テキスト内の透かしセグメントの正確な位置を特定するための適応的オンライン学習アルゴリズムを導入する。3つの一般的な電子透かし技術(KGW-Watermark、Unigram-Watermark、Gumbel-Watermark)で評価した結果、我々のアプローチは高い精度を達成し、ベースライン手法を大幅に凌駕した。さらに、我々のフレームワークは他の電子透かし技術にも適応可能であり、正確な電子透かし検出のための新たな知見を提供する。

要約(オリジナル)

Text watermarks in large language models (LLMs) are increasingly used to detect synthetic text, mitigating misuse cases like fake news and academic dishonesty. While existing watermarking detection techniques primarily focus on classifying entire documents as watermarked or not, they often neglect the common scenario of identifying individual watermark segments within longer, mixed-source documents. Drawing inspiration from plagiarism detection systems, we propose two novel methods for partial watermark detection. First, we develop a geometry cover detection framework aimed at determining whether there is a watermark segment in long text. Second, we introduce an adaptive online learning algorithm to pinpoint the precise location of watermark segments within the text. Evaluated on three popular watermarking techniques (KGW-Watermark, Unigram-Watermark, and Gumbel-Watermark), our approach achieves high accuracy, significantly outperforming baseline methods. Moreover, our framework is adaptable to other watermarking techniques, offering new insights for precise watermark detection.

arxiv情報

著者 Xuandong Zhao,Chenwen Liao,Yu-Xiang Wang,Lei Li
発行日 2024-10-04 16:58:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク