Q-Refine: A Perceptual Quality Refiner for AI-Generated Image

要約

近年の Text-to-Image (T2I) モデルの急速な進化に伴い、満足のいく生成結果が得られないことが課題となっています。
ただし、さまざまな品質の AI 生成画像 (AIGI) を均一に精製すると、低品質の AIGI の最適化機能が制限されるだけでなく、高品質の AIGI にもマイナスの最適化がもたらされます。
この問題に対処するために、Q-Refine という名前の品質賞リファイナーが提案されています。
人間の視覚システム (HVS) の好みに基づいて、Q-Refine は画質評価 (IQA) メトリックを使用して初めて調整プロセスをガイドし、3 つの適応パイプラインを通じてさまざまな品質の画像を変更します。
実験では、主流の T2I モデルに対して、Q-Refine がさまざまな品質の AIGI に対して効果的な最適化を実行できることを示しています。
これは、忠実度と美的品質レベルの両方から AIGI を最適化するための一般的なリファイナーとなり、T2I 生成モデルの適用を拡大します。

要約(オリジナル)

With the rapid evolution of the Text-to-Image (T2I) model in recent years, their unsatisfactory generation result has become a challenge. However, uniformly refining AI-Generated Images (AIGIs) of different qualities not only limited optimization capabilities for low-quality AIGIs but also brought negative optimization to high-quality AIGIs. To address this issue, a quality-award refiner named Q-Refine is proposed. Based on the preference of the Human Visual System (HVS), Q-Refine uses the Image Quality Assessment (IQA) metric to guide the refining process for the first time, and modify images of different qualities through three adaptive pipelines. Experimental shows that for mainstream T2I models, Q-Refine can perform effective optimization to AIGIs of different qualities. It can be a general refiner to optimize AIGIs from both fidelity and aesthetic quality levels, thus expanding the application of the T2I generation models.

arxiv情報

著者 Chunyi Li,Haoning Wu,Zicheng Zhang,Hongkun Hao,Kaiwei Zhang,Lei Bai,Xiaohong Liu,Xiongkuo Min,Weisi Lin,Guangtao Zhai
発行日 2024-01-02 09:11:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク