Using Set Covering to Generate Databases for Holistic Steganalysis


したがって、配布外のカバーに関してはパフォーマンスのギャップは避けられず、これはカバー ソースの不一致 (CSM) と呼ばれる非常に頻繁なシナリオです。
ここでは、CSM の起源を研究し、CSM をよりよく理解し、より適切に取り組むために、処理パイプラインのグリッドを探索します。
私たちの主な貢献は、運用上の CSM に取り組むことができる関連ベースを生成するための方法論です。
実験による検証では、トレーニング サンプルの数が一定である場合、ランダムなパイプラインを選択したり、利用可能なすべてのパイプラインを使用したりするよりも、セットをカバーする選択の方が優れた戦略であることがわかりました。
追加のリソースは、 で入手できます。


Within an operational framework, covers used by a steganographer are likely to come from different sensors and different processing pipelines than the ones used by researchers for training their steganalysis models. Thus, a performance gap is unavoidable when it comes to out-of-distributions covers, an extremely frequent scenario called Cover Source Mismatch (CSM). Here, we explore a grid of processing pipelines to study the origins of CSM, to better understand it, and to better tackle it. A set-covering greedy algorithm is used to select representative pipelines minimizing the maximum regret between the representative and the pipelines within the set. Our main contribution is a methodology for generating relevant bases able to tackle operational CSM. Experimental validation highlights that, for a given number of training samples, our set covering selection is a better strategy than selecting random pipelines or using all the available pipelines. Our analysis also shows that parameters as denoising, sharpening, and downsampling are very important to foster diversity. Finally, different benchmarks for classical and wild databases show the good generalization property of the extracted databases. Additional resources are available at


著者 Rony Abecidan,Vincent Itier,Jérémie Boulanger,Patrick Bas,Tomáš Pevný
発行日 2023-12-28 08:15:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV, cs.MM, eess.IV パーマリンク