要約
ブラインド画像品質評価 (BIQA) の既存の学習ベースの方法は、大量の注釈付きトレーニング データに大きく依存しており、ドメイン/分布シフトの問題が発生すると、通常はパフォーマンスが大幅に低下します。
教師なしドメイン適応 (UDA) の開発のおかげで、一部の研究では、UDA を使用したドメイン シフトの下で、ラベル十分なソース ドメインからラベルのないターゲット ドメインに知識を転送しようと試みています。
ただし、ソース データとターゲット データの共存が必要であり、プライバシーやストレージの問題により、ソース データには実用的ではない可能性があります。
このホワイト ペーパーでは、BIQA がソース データにアクセスせずにドメイン シフトに取り組むためのシンプルかつ効率的な方法で、ソースフリーの教師なしドメイン適応 (SFUDA) に向けた第一歩を踏み出します。
具体的には、品質評価タスクを評価分布予測問題としてキャストします。
BIQA の固有のプロパティに基づいて、BN アフィン パラメーターのターゲット ドメインへの適応をガイドするために、適切に設計された自己教師付き目標のグループを提示します。
その中で、予測エントロピーを最小化し、バッチ予測の多様性を最大化することは、自明な解決策を回避しながら、より信頼できる結果を促進することを目的としています。
さらに、単一画像の IQA 評価分布がガウス分布に従うという観察に基づいて、ガウス正則化を予測評価分布に適用して、人間の採点の性質とより一致させます。
クロスドメインシナリオでの広範な実験結果は、ドメインシフトを軽減するための提案された方法の有効性を実証しました。
要約(オリジナル)
Existing learning-based methods for blind image quality assessment (BIQA) are heavily dependent on large amounts of annotated training data, and usually suffer from a severe performance degradation when encountering the domain/distribution shift problem. Thanks to the development of unsupervised domain adaptation (UDA), some works attempt to transfer the knowledge from a label-sufficient source domain to a label-free target domain under domain shift with UDA. However, it requires the coexistence of source and target data, which might be impractical for source data due to the privacy or storage issues. In this paper, we take the first step towards the source-free unsupervised domain adaptation (SFUDA) in a simple yet efficient manner for BIQA to tackle the domain shift without access to the source data. Specifically, we cast the quality assessment task as a rating distribution prediction problem. Based on the intrinsic properties of BIQA, we present a group of well-designed self-supervised objectives to guide the adaptation of the BN affine parameters towards the target domain. Among them, minimizing the prediction entropy and maximizing the batch prediction diversity aim to encourage more confident results while avoiding the trivial solution. Besides, based on the observation that the IQA rating distribution of single image follows the Gaussian distribution, we apply Gaussian regularization to the predicted rating distribution to make it more consistent with the nature of human scoring. Extensive experimental results under cross-domain scenarios demonstrated the effectiveness of our proposed method to mitigate the domain shift.
arxiv情報
著者 | Jianzhao Liu,Xin Li,Shukun An,Zhibo Chen |
発行日 | 2022-08-15 09:33:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google