要約
強力な画像編集ツールが広く使用されるようになったことで、画像の改ざんが容易かつ現実的になりました。
既存の画像フォレンジック手法は、依然として精度と堅牢性の低さという課題に直面しています。
改ざんされた領域は通常、セマンティック オブジェクトであることに注意してください。このレターでは、深いセマンティック セグメンテーション ネットワークに基づく効果的な画像改ざんローカリゼーション スキームを提案します。
ConvNeXt ネットワークは、より良い特徴表現を学習するためのエンコーダーとして使用されます。
次に、マルチスケール機能が Upernet デコーダーによって融合され、より優れた位置特定機能が実現されます。
効果的なモデルのトレーニングを確実にするために、結合された損失と効果的なデータ拡張が採用されています。
広範な実験結果により、提案されたスキームのローカリゼーションパフォーマンスが他の最先端のものよりも優れていることが確認されています。
要約(オリジナル)
With the widespread use of powerful image editing tools, image tampering becomes easy and realistic. Existing image forensic methods still face challenges of low accuracy and robustness. Note that the tampered regions are typically semantic objects, in this letter we propose an effective image tampering localization scheme based on deep semantic segmentation network. ConvNeXt network is used as an encoder to learn better feature representation. The multi-scale features are then fused by Upernet decoder for achieving better locating capability. Combined loss and effective data augmentation are adopted to ensure effective model training. Extensive experimental results confirm that localization performance of our proposed scheme outperforms other state-of-the-art ones.
arxiv情報
著者 | Haochen Zhu,Gang Cao,Mo Zhao |
発行日 | 2022-08-30 14:19:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google