要約
テキストから画像への生成モデルの急速な進歩に伴い、AI 生成画像 (AGI) はエンターテインメント、教育、ソーシャル メディアなどに広く適用されています。しかし、AGI ごとに品質に大きなばらつきがあることを考慮すると、早急に改善を図る必要があります。
人間の主観的な評価と一致する高品質のモデルの必要性。
この問題に対処するために、私たちはさまざまな人気のある AGI モデル、さまざまなプロンプトとモデル パラメーターを通じて生成された AGI を徹底的に検討し、知覚品質とテキストと画像の位置合わせで主観的スコアを収集し、最も包括的な AGI 主観的品質データベース AGIQA-3K を構築しました。
ここのところ。
さらに、このデータベース上でベンチマーク実験を実施し、現在の画質評価 (IQA) モデルと人間の知覚との整合性を評価するとともに、主観的なテキストと画像の位置合わせの評価パフォーマンスを大幅に向上させる StairReward を提案します。
私たちは、AGIQA-3K のきめ細かい主観スコアが、その後の AGI 品質モデルを刺激し、知覚レベルとアライメント レベルの両方で人間の主観的な知覚メカニズムに適合させ、将来の AGI モデルの生成結果を最適化すると信じています。
データベースは https://github.com/lcysyzxdxc/AGIQA-3k-Database で公開されています。
要約(オリジナル)
With the rapid advancements of the text-to-image generative model, AI-generated images (AGIs) have been widely applied to entertainment, education, social media, etc. However, considering the large quality variance among different AGIs, there is an urgent need for quality models that are consistent with human subjective ratings. To address this issue, we extensively consider various popular AGI models, generated AGI through different prompts and model parameters, and collected subjective scores at the perceptual quality and text-to-image alignment, thus building the most comprehensive AGI subjective quality database AGIQA-3K so far. Furthermore, we conduct a benchmark experiment on this database to evaluate the consistency between the current Image Quality Assessment (IQA) model and human perception, while proposing StairReward that significantly improves the assessment performance of subjective text-to-image alignment. We believe that the fine-grained subjective scores in AGIQA-3K will inspire subsequent AGI quality models to fit human subjective perception mechanisms at both perception and alignment levels and to optimize the generation result of future AGI models. The database is released on https://github.com/lcysyzxdxc/AGIQA-3k-Database.
arxiv情報
著者 | Chunyi Li,Zicheng Zhang,Haoning Wu,Wei Sun,Xiongkuo Min,Xiaohong Liu,Guangtao Zhai,Weisi Lin |
発行日 | 2023-06-12 16:42:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google