要約
ディープ ニューラル ネットワークはさまざまなタスクに便利な用途がありますが、そのパフォーマンスはデータ分布の変化によって大きく影響される可能性があります。
たとえば、生物医学分野では、トレーニング データセットとテスト データセットの間でのデータ (さまざまなマシン、母集団) の変化によってパフォーマンスが影響を受ける可能性があります。
現実世界のシナリオに対する堅牢性と一般化を確保するために、推論中にモデルを新しいデータ分布に調整するアプローチとして、テスト時の適応が最近研究されています。
テスト時のバッチ正規化は、ドメイン シフト ベンチマークで魅力的なパフォーマンスを実現するシンプルで一般的な方法です。
これは、テスト バッチのバッチ正規化統計を再計算することによって実装されます。
これまでの研究は、トレーニング データと同じラベル分布を持つテスト データを使用した分析に焦点を当てていました。
ただし、多くの実際のアプリケーションでは、この手法はラベル配布の変更に対して脆弱であり、場合によっては壊滅的な障害が発生します。
これは、展開時にテスト時間適応方法を適用する際にリスクをもたらします。
私たちは、深いネットワーク内のチャネルのみを選択的に適応させ、ラベルのシフトに敏感な大幅な適応を最小限に抑えることで、この課題に取り組むことを提案します。
私たちの選択スキームは、私たちが経験的に動機付けている 2 つの原則に基づいています: (1) ネットワークの後の層ほどラベル シフトの影響を受けやすい (2) 個々の機能は特定のクラスの影響を受けやすい。
提案された手法を、CIFAR10-C、Imagenet-C、脂肪肝の診断を含む 3 つの分類タスクに適用し、共変量とラベルの分布シフトの両方を調査します。
私たちの方法は、他の方法によくある失敗のリスクを大幅に軽減しながら、ハイパーパラメーターの選択に対して堅牢であると同時に、TTA の利点をもたらすことができることがわかりました。
要約(オリジナル)
Deep neural networks have useful applications in many different tasks, however their performance can be severely affected by changes in the data distribution. For example, in the biomedical field, their performance can be affected by changes in the data (different machines, populations) between training and test datasets. To ensure robustness and generalization to real-world scenarios, test-time adaptation has been recently studied as an approach to adjust models to a new data distribution during inference. Test-time batch normalization is a simple and popular method that achieved compelling performance on domain shift benchmarks. It is implemented by recalculating batch normalization statistics on test batches. Prior work has focused on analysis with test data that has the same label distribution as the training data. However, in many practical applications this technique is vulnerable to label distribution shifts, sometimes producing catastrophic failure. This presents a risk in applying test time adaptation methods in deployment. We propose to tackle this challenge by only selectively adapting channels in a deep network, minimizing drastic adaptation that is sensitive to label shifts. Our selection scheme is based on two principles that we empirically motivate: (1) later layers of networks are more sensitive to label shift (2) individual features can be sensitive to specific classes. We apply the proposed technique to three classification tasks, including CIFAR10-C, Imagenet-C, and diagnosis of fatty liver, where we explore both covariate and label distribution shifts. We find that our method allows to bring the benefits of TTA while significantly reducing the risk of failure common in other methods, while being robust to choice in hyperparameters.
arxiv情報
著者 | Pedro Vianna,Muawiz Chaudhary,Paria Mehrbod,An Tang,Guy Cloutier,Guy Wolf,Michael Eickenberg,Eugene Belilovsky |
発行日 | 2024-02-07 15:41:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google