要約
AI生成コンテンツ(AIGC)は急速に拡大しており、高度な生成モデルを用いてリアルな画像や流暢なテキストを作成するサービスが登場している。このようなコンテンツを規制することは、無許可の商品化や安全でないコンテンツの配布といったポリシー違反を防ぐために極めて重要である。電子透かしは、コンテンツの帰属と検証のための有望なソリューションであるが、我々は、2つの主要な攻撃に対する脆弱性を実証する。(1)敵対者が規制を回避するために埋め込まれたマークを消去する電子透かし除去、(2)敵対者が偽造された電子透かしを使用して不正なコンテンツを生成し、誤帰属につながる電子透かし偽造。我々は、コンテンツ処理のための事前訓練された拡散モデルと電子透かし操作のための生成的敵対的ネットワークを活用した統一的な攻撃フレームワークであるWarfareを提案する。データセットや埋め込みセットアップを横断的に評価した結果、Warfareはコンテンツの品質を保ちながら高い成功率を達成することがわかった。さらに、有効性を損なうことなく効率を高めるWarfare-Plusを紹介する。コードはhttps://github.com/GuanlinLee/warfare。
要約(オリジナル)
AI-Generated Content (AIGC) is rapidly expanding, with services using advanced generative models to create realistic images and fluent text. Regulating such content is crucial to prevent policy violations, such as unauthorized commercialization or unsafe content distribution. Watermarking is a promising solution for content attribution and verification, but we demonstrate its vulnerability to two key attacks: (1) Watermark removal, where adversaries erase embedded marks to evade regulation, and (2) Watermark forging, where they generate illicit content with forged watermarks, leading to misattribution. We propose Warfare, a unified attack framework leveraging a pre-trained diffusion model for content processing and a generative adversarial network for watermark manipulation. Evaluations across datasets and embedding setups show that Warfare achieves high success rates while preserving content quality. We further introduce Warfare-Plus, which enhances efficiency without compromising effectiveness. The code can be found in https://github.com/GuanlinLee/warfare.
arxiv情報
著者 | Guanlin Li,Yifei Chen,Jie Zhang,Shangwei Guo,Han Qiu,Guoyin Wang,Jiwei Li,Tianwei Zhang |
発行日 | 2025-02-03 06:53:40+00:00 |
arxivサイト | arxiv_id(pdf) |