Modularity Trumps Invariance for Compositional Robustness

要約

デフォルトでは、ニューラル ネットワークはデータ分布の変化に対して堅牢ではありません。
これは、ぼやけたりノイズを追加したりするなどの単純な画像破損で実証されており、画像分類パフォーマンスが低下します。
これらの問題を軽減するために多くの方法が提案されていますが、ほとんどのモデルは単一の破損に対して評価されます。
実際には、視覚空間は本質的に構成的なものです。つまり、要素の破損に対する堅牢性だけでなく、破損の構成に対する堅牢性も必要です。
この研究では、いくつかの要素の破損が与えられた場合に、モデルがこれらの破損の構成を一般化するように求められる、構成画像分類タスクを開発します。
つまり、構成上の堅牢性を達成するためです。
我々は経験的リスク最小化と不変性構築ペアワイズ対比損失を実験的に比較し、領域一般化における一般的な直観に反して、不変性を促進することによって構成の堅牢性のわずかな改善しか達成しません。
不変性を超えるために、モデル アーキテクチャはデータ構造を反映する必要があるという以前に提案された帰納的バイアスに従い、その構造がタスクの構成的性質を複製するモジュラー アーキテクチャを導入します。
次に、このモジュール式アプローチが、非モジュール式アプローチよりも優れた構成堅牢性を一貫して達成できることを示します。
さらに、「分布内」の要素破損の表現間の不変性の程度は、「分布外」の破損構成に対する堅牢性と相関関係がないという経験的証拠も見つかりました。

要約(オリジナル)

By default neural networks are not robust to changes in data distribution. This has been demonstrated with simple image corruptions, such as blurring or adding noise, degrading image classification performance. Many methods have been proposed to mitigate these issues but for the most part models are evaluated on single corruptions. In reality, visual space is compositional in nature, that is, that as well as robustness to elemental corruptions, robustness to compositions of corruptions is also needed. In this work we develop a compositional image classification task where, given a few elemental corruptions, models are asked to generalize to compositions of these corruptions. That is, to achieve compositional robustness. We experimentally compare empirical risk minimization with an invariance building pairwise contrastive loss and, counter to common intuitions in domain generalization, achieve only marginal improvements in compositional robustness by encouraging invariance. To move beyond invariance, following previously proposed inductive biases that model architectures should reflect data structure, we introduce a modular architecture whose structure replicates the compositional nature of the task. We then show that this modular approach consistently achieves better compositional robustness than non-modular approaches. We additionally find empirical evidence that the degree of invariance between representations of ‘in-distribution’ elemental corruptions fails to correlate with robustness to ‘out-of-distribution’ compositions of corruptions.

arxiv情報

著者 Ian Mason,Anirban Sarkar,Tomotake Sasaki,Xavier Boix
発行日 2023-06-15 10:04:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク