要約
電子透かしは、マルチメディア コンテンツの保護に有効であることが実証されています。
しかし、既存の透かしは主に特定のメディア タイプに合わせて調整されているため、マルチモーダルで動的であることが多いコンピュータ画面に表示されるコンテンツの保護にはあまり効果的ではありません。
Visual Screen Content (VSC) は、特にスクリーンショットによる盗難や漏洩の影響を受けやすく、現在の透かし手法では適切に対処できない脆弱性です。これらの課題に取り組むために、任意の VSC 保護用に特別に設計された堅牢で実用的な透かし手法である ScreenMark を提案します。
ScreenMark は、3 段階のプログレッシブ透かしフレームワークを利用します。
最初に、拡散原理に触発されて、通常の透かし情報と不規則な透かしパターンの間の相互変換を初期化します。
その後、これらのパターンは、事前乗算アルファ ブレンディング技術を使用して画面コンテンツと統合され、正確な透かしの取得のために事前にトレーニングされた画面デコーダーによってサポートされます。
徐々に複雑になるディストータにより、実際のスクリーンショットのシナリオにおける透かしの堅牢性が強化されます。
最後に、最適なパフォーマンスを確保するために、ジョイント レベルのディストーターによってモデルが微調整されます。ScreenMark の有効性を検証するために、さまざまなデバイスと解像度からの 100,000 枚のスクリーンショットで構成されるデータセットをコンパイルしました。
さまざまなデータセットにわたる広範な実験により、この方法の優れた堅牢性、知覚されにくいこと、および実用的な適用可能性が確認されています。
要約(オリジナル)
Digital watermarking has demonstrated its effectiveness in protecting multimedia content. However, existing watermarking are predominantly tailored for specific media types, rendering them less effective for the protection of content displayed on computer screens, which is often multimodal and dynamic. Visual Screen Content (VSC), is particularly susceptible to theft and leakage via screenshots, a vulnerability that current watermarking methods fail to adequately address.To tackle these challenges, we propose ScreenMark, a robust and practical watermarking method designed specifically for arbitrary VSC protection. ScreenMark utilizes a three-stage progressive watermarking framework. Initially, inspired by diffusion principles, we initialize the mutual transformation between regular watermark information and irregular watermark patterns. Subsequently, these patterns are integrated with screen content using a pre-multiplication alpha blending technique, supported by a pre-trained screen decoder for accurate watermark retrieval. The progressively complex distorter enhances the robustness of the watermark in real-world screenshot scenarios. Finally, the model undergoes fine-tuning guided by a joint-level distorter to ensure optimal performance.To validate the effectiveness of ScreenMark, we compiled a dataset comprising 100,000 screenshots from various devices and resolutions. Extensive experiments across different datasets confirm the method’s superior robustness, imperceptibility, and practical applicability.
arxiv情報
著者 | Xiujian Liang,Gaozhi Liu,Yichao Si,Xiaoxiao Hu,Zhenxing Qian,Xinpeng Zhang |
発行日 | 2024-09-05 12:52:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google