DBDH: A Dual-Branch Dual-Head Neural Network for Invisible Embedded Regions Localization

要約

QRコードに代わる不可視のハイパーリンクや隠しコードを画像に埋め込むことが最近話題になっている。この技術では、デコードの前に、まずキャプチャされた写真内の埋め込み領域をローカライズする必要がある。見えない埋め込み領域を見つけるためにモデルを訓練する既存の方法は、正確なローカライズの結果を得るのに苦労し、デコード精度の低下につながる。この限界は主に、CNNネットワークが低周波数の信号に敏感であるのに対し、埋め込み信号は一般的に高周波数であるためである。これに基づき、本論文では、見えない埋め込み領域の正確な位置特定用に調整されたDBDH(Dual-Branch Dual-Head)ニューラルネットワークを提案する。具体的には、DBDHは62個のハイパスフィルタを含む低レベルのテクスチャブランチを用いて、埋め込みによって誘発される高周波信号を捕捉する。高レベルのコンテキスト・ブランチは、埋め込み領域と通常領域の識別特徴を抽出するために使用される。DBDHは、埋め込み領域の4つの頂点を直接検出する検出ヘッドを採用する。さらに、埋め込み領域のマスクをセグメンテーションするためのセグメンテーションヘッドを導入する。セグメンテーションヘッドはモデル学習にピクセルレベルの監視を提供し、埋め込み信号のより良い学習を促進する。2つの最先端の不可視のオフラインからオンラインへのメッセージング手法に基づいて、ローカライゼーションモデルの学習とテストのための2つのデータセットと増強戦略を構築する。広範な実験により、提案するDBDHが既存の手法よりも優れた性能を持つことを実証する。

要約(オリジナル)

Embedding invisible hyperlinks or hidden codes in images to replace QR codes has become a hot topic recently. This technology requires first localizing the embedded region in the captured photos before decoding. Existing methods that train models to find the invisible embedded region struggle to obtain accurate localization results, leading to degraded decoding accuracy. This limitation is primarily because the CNN network is sensitive to low-frequency signals, while the embedded signal is typically in the high-frequency form. Based on this, this paper proposes a Dual-Branch Dual-Head (DBDH) neural network tailored for the precise localization of invisible embedded regions. Specifically, DBDH uses a low-level texture branch containing 62 high-pass filters to capture the high-frequency signals induced by embedding. A high-level context branch is used to extract discriminative features between the embedded and normal regions. DBDH employs a detection head to directly detect the four vertices of the embedding region. In addition, we introduce an extra segmentation head to segment the mask of the embedding region during training. The segmentation head provides pixel-level supervision for model learning, facilitating better learning of the embedded signals. Based on two state-of-the-art invisible offline-to-online messaging methods, we construct two datasets and augmentation strategies for training and testing localization models. Extensive experiments demonstrate the superior performance of the proposed DBDH over existing methods.

arxiv情報

著者 Chengxin Zhao,Hefei Ling,Sijing Xie,Nan Sun,Zongyi Li,Yuxuan Shi,Jiazhong Chen
発行日 2024-05-06 12:59:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.MM パーマリンク