Domain Decorrelation with Potential Energy Ranking

要約

機械学習システム、特に深層学習に基づく方法は、実験的な設定の下で最新のコンピュータービジョンタスクで大きな成功を収めています。
一般に、これらの古典的な深層学習方法は、トレーニングデータとテストデータが独立して同一に類似した分布から抽出されると仮定して、\emph{i.i.d。}の仮定に基づいて構築されています。
ただし、前述の\ emph {i.i.d.}の仮定は、実際のシナリオでは一般に利用できず、その結果、深層学習アルゴリズムのパフォーマンスが急激に低下します。
この背後にあるドメインシフトは、非難されるべき主要な要因の1つです。
この問題に取り組むために、\ textbf {Po} tential \ textbf {E} nergy \ textbf {R} anking(PoER)を使用して、オブジェクト機能とドメイン機能(\ emph {つまり}外観機能)を分離することを提案します。
与えられた画像で、オブジェクトと背景の間の無関係な相関関係を除外しながら、ラベル識別機能の学習を促進します。
PoERは、ニューラルネットワークが最初に浅い層にドメイン情報を含むラベル関連の特徴をキャプチャし、次にラベル識別表現を徐々に抽出するのを支援し、ニューラルネットワークがオブジェクトと背景の特性を認識するように強制します。
ドメイン不変の特徴の生成。
PoERは、ドメイン一般化ベンチマークで優れたパフォーマンスを報告し、既存の方法と比較して、トップ1の平均精度を少なくとも1.20 \%向上させます。
さらに、ECCV 2022NICOチャレンジ\脚注{https://nicochallenge.com}でPoERを使用し、バニラのResNet-18だけでトップの座を獲得しています。
コードはhttps://github.com/ForeverPs/PoERで入手できます。

要約(オリジナル)

Machine learning systems, especially the methods based on deep learning, enjoy great success in modern computer vision tasks under experimental settings. Generally, these classic deep learning methods are built on the \emph{i.i.d.} assumption, supposing the training and test data are drawn from a similar distribution independently and identically. However, the aforementioned \emph{i.i.d.} assumption is in general unavailable in the real-world scenario, and as a result, leads to sharp performance decay of deep learning algorithms. Behind this, domain shift is one of the primary factors to be blamed. In order to tackle this problem, we propose using \textbf{Po}tential \textbf{E}nergy \textbf{R}anking (PoER) to decouple the object feature and the domain feature (\emph{i.e.,} appearance feature) in given images, promoting the learning of label-discriminative features while filtering out the irrelevant correlations between the objects and the background. PoER helps the neural networks to capture label-related features which contain the domain information first in shallow layers and then distills the label-discriminative representations out progressively, enforcing the neural networks to be aware of the characteristic of objects and background which is vital to the generation of domain-invariant features. PoER reports superior performance on domain generalization benchmarks, improving the average top-1 accuracy by at least 1.20\% compared to the existing methods. Moreover, we use PoER in the ECCV 2022 NICO Challenge\footnote{https://nicochallenge.com}, achieving top place with only a vanilla ResNet-18. The code has been made available at https://github.com/ForeverPs/PoER.

arxiv情報

著者 Sen Pei,Jiaxi Sun,Shiming Xiang,Gaofeng Meng
発行日 2022-07-26 01:27:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク