Frequency Dropout: Feature-Level Regularization via Randomized Filtering

要約

深い畳み込みニューラル ネットワークは、さまざまなコンピューター ビジョン タスクで優れたパフォーマンスを示していますが、トレーニング信号から誤った相関関係を検出する可能性があります。
いわゆる「ショートカット」は、学習中に発生する可能性があります。たとえば、出力予測と相関する特定の周波数が画像データに存在する場合です。
高周波数と低周波数の両方が、画像コンテンツに関するタスク関連の情報に関連するというよりも、画像取得によって引き起こされる根本的なノイズ分布の特徴である可能性があります。
この特徴的なノイズに関連する特徴を学習したモデルは、新しいデータにうまく一般化されません。
この作業では、畳み込みニューラル ネットワークが周波数固有のイメージング機能を学習するのを防ぐために、シンプルで効果的なトレーニング戦略、Frequency Dropout を提案します。
機能レベルの正則化として機能するトレーニング中に、機能マップのランダム化されたフィルタリングを採用しています。
この研究では、ガウス平滑化、ガウスのラプラシアン、ガボール フィルタリングなどの一般的な画像処理フィルターを検討します。
私たちのトレーニング戦略はモデルにとらわれず、あらゆるコンピューター ビジョン タスクに使用できます。
コンピューター ビジョンと医用画像データセットの両方を使用して、画像分類、ドメイン適応、セマンティック セグメンテーションなど、さまざまな一般的なアーキテクチャと複数のタスクに対する Frequency Dropout の有効性を示します。
私たちの結果は、提案されたアプローチが予測精度を向上させるだけでなく、ドメインシフトに対するロバスト性も向上させることを示唆しています。

要約(オリジナル)

Deep convolutional neural networks have shown remarkable performance on various computer vision tasks, and yet, they are susceptible to picking up spurious correlations from the training signal. So called `shortcuts’ can occur during learning, for example, when there are specific frequencies present in the image data that correlate with the output predictions. Both high and low frequencies can be characteristic of the underlying noise distribution caused by the image acquisition rather than in relation to the task-relevant information about the image content. Models that learn features related to this characteristic noise will not generalize well to new data. In this work, we propose a simple yet effective training strategy, Frequency Dropout, to prevent convolutional neural networks from learning frequency-specific imaging features. We employ randomized filtering of feature maps during training which acts as a feature-level regularization. In this study, we consider common image processing filters such as Gaussian smoothing, Laplacian of Gaussian, and Gabor filtering. Our training strategy is model-agnostic and can be used for any computer vision task. We demonstrate the effectiveness of Frequency Dropout on a range of popular architectures and multiple tasks including image classification, domain adaptation, and semantic segmentation using both computer vision and medical imaging datasets. Our results suggest that the proposed approach does not only improve predictive accuracy but also improves robustness against domain shift.

arxiv情報

著者 Mobarakol Islam,Ben Glocker
発行日 2022-09-20 16:42:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク