Frequency Decomposition to Tap the Potential of Single Domain for Generalization

要約

タイトル:汎化を促進するためのシングルドメインの周波数分解

要約:
– 人工知能の一般的な特徴である、複数の未知のドメインで動作することを目的としたドメイン一般化(DG)は必須である。
– シングルソースドメイントレーニングデータに基づくDGは、ドメイン不変の特徴を同定するための比較可能な情報の不足のためにより困難である。
– この論文では、シングルソースドメイントレーニングサンプルにドメイン不変の特徴が含まれている可能性があることが判明した。次に、シングルソースドメインサンプルからこのようなドメイン不変の特徴を抽出する適切な方法を見つけることが課題となる。
– ドメイン不変の特徴は周波数に密接に関連しているという仮定がなされた。その後、複数の周波数ドメインを学習する新しい手法が提案された。
– オリジナルの画像の周波数ドメインを複数のサブドメインに分割し、設計された二つのブランチネットワークでサブドメインの特徴を学習することで、モデルは特定のスペクトルのより多くのサンプルから特徴を学習するように強制される。これにより、以前は簡単に学習できる特徴によって不明確にされていたドメイン不変の特徴を得る可能性が増す。
– 結果として、周波数分解は困難な特徴を学習するのに役立ち、提案された方法はシングルソースドメイン一般化の最新の方法よりも優れていることが広範な実験調査により明らかになった。

要約(オリジナル)

Domain generalization (DG), aiming at models able to work on multiple unseen domains, is a must-have characteristic of general artificial intelligence. DG based on single source domain training data is more challenging due to the lack of comparable information to help identify domain invariant features. In this paper, it is determined that the domain invariant features could be contained in the single source domain training samples, then the task is to find proper ways to extract such domain invariant features from the single source domain samples. An assumption is made that the domain invariant features are closely related to the frequency. Then, a new method that learns through multiple frequency domains is proposed. The key idea is, dividing the frequency domain of each original image into multiple subdomains, and learning features in the subdomain by a designed two branches network. In this way, the model is enforced to learn features from more samples of the specifically limited spectrum, which increases the possibility of obtaining the domain invariant features that might have previously been defiladed by easily learned features. Extensive experimental investigation reveals that 1) frequency decomposition can help the model learn features that are difficult to learn. 2) the proposed method outperforms the state-of-the-art methods of single-source domain generalization.

arxiv情報

著者 Qingyue Yang,Hongjing Niu,Pengfei Xia,Wei Zhang,Bin Li
発行日 2023-04-14 17:15:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク