Improving Domain-Invariance in Self-Supervised Learning via Batch Styles Standardization

要約

タイトル:自己教師あり学習におけるバッチスタイル標準化によるドメイン不変性の改善

要約:
– 自己教師あり学習(Self-Supervised Learning: SSL)は、限られたラベル付きデータと豊富なラベルなしデータを使用するための主要な戦略の1つとして、この数年で広く使用されている。
– 一般的に、SSLモデルは、同じデータ分布、すなわちイン・ディストリビューション環境で事前学習、ファインチューニング、評価される。
– しかし、彼らは領域外評価シナリオにおいてパフォーマンスが低い傾向がある。これは、非監督ドメイン汎化(Unsupervised Domain Generalization: UDG)が対処しようとしている課題の1つである。
– 本論文は、バッチ内の画像スタイルを標準化する新しい方法を紹介する。バッチスタイル標準化には、フーリエベースの拡張が使用され、ドメイン不変性を促進し、特徴から見たスパイク相関を防ぐことができる。
– また、バッチスタイル標準化を、よく知られたコントラスティブベースの手法SimCLRと組み合わせることで、新しいUDG手法CLaSSy (コントラスティブ学習による標準化スタイル)が生まれる。
– CLaSSyは、ドメインラベルに頼らず、多数のドメインを処理できることなど、従来の手法と比べて重要な利点を提供する。
– 評価実験において、さまざまなUDGデータセットに対しCLaSSyが従来のUDG手法よりも優れたパフォーマンスを発揮することが確認される。
– 提案されたバッチスタイル標準化の汎用性は、異なるバックボーン構成(畳み込みベース、トランスフォーマーベース)を考慮したコントラスティブベースと非コントラスティブベースのSSL手法 (SWaV, MSN)の拡張によって実証される。

要約(オリジナル)

The recent rise of Self-Supervised Learning (SSL) as one of the preferred strategies for learning with limited labeled data, and abundant unlabeled data has led to the widespread use of these models. They are usually pretrained, finetuned, and evaluated on the same data distribution, i.e., within an in-distribution setting. However, they tend to perform poorly in out-of-distribution evaluation scenarios, a challenge that Unsupervised Domain Generalization (UDG) seeks to address. This paper introduces a novel method to standardize the styles of images in a batch. Batch styles standardization, relying on Fourier-based augmentations, promotes domain invariance in SSL by preventing spurious correlations from leaking into the features. The combination of batch styles standardization with the well-known contrastive-based method SimCLR leads to a novel UDG method named CLaSSy ($\textbf{C}$ontrastive $\textbf{L}$e$\textbf{a}$rning with $\textbf{S}$tandardized $\textbf{S}$t$\textbf{y}$les). CLaSSy offers serious advantages over prior methods, as it does not rely on domain labels and is scalable to handle a large number of domains. Experimental results on various UDG datasets demonstrate the superior performance of CLaSSy compared to existing UDG methods. Finally, the versatility of the proposed batch styles standardization is demonstrated by extending respectively the contrastive-based and non-contrastive-based SSL methods, SWaV and MSN, while considering different backbone architectures (convolutional-based, transformers-based).

arxiv情報

著者 Marin Scalbert,Maria Vakalopoulou,Florent Couzinié-Devy
発行日 2023-04-24 10:04:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク