An Image Quality Assessment Dataset for Portraits

要約

タイトル:肖像画のための画像品質評価データセット
要約:スマートフォンの写真は年々向上しており、特にポートレート写真の分野において需要が高まっています。製造業者はスマートフォンカメラの開発において知覚品質の基準を使用しています。画像品質評価(IQA)のための自動学習ベースの手法は、このコストのかかる手順の一部を代替することができます。主観的性質があるため、IQAプロセスの一貫性を推定し保証する必要があり、これはクラウドソーシングIQAに広く使用される平均意見スコア(MOS)に欠けています。さらに、既存の盲目のIQA(BIQA)データセットは、異なるコンテンツの評価の難易度にほとんど注意を払っていないため、注釈の品質が低下する可能性があります。この論文では、50の事前定義されたシナリオの5116枚の画像を含む、様々なブランド、モデル、使用用途をカバーした100台のスマートフォンによって獲得された、ポートレート専用のIQAデータセットであるPIQ23を紹介します。データセットには、様々な人種や性別の個人が含まれており、彼らの写真を公的研究に使用することに明示的かつ知らされた同意を得ています。データセットは、顔の詳細な保存、顔の目標露光、全体的な画像品質の3つの画像属性について、30人以上の画像品質専門家によるペア比較(PWC)で注釈が付けられています。これらの注釈の詳細な統計分析により、PIQ23上での一貫性を評価することができます。最後に、提案される統計分析とBIQAアルゴリズムとともに、意味情報(画像の文脈)を使用してIQA予測を改善できることを既存のベースラインとの包括的な比較を通じて示します。データセットは以下から入手可能です:https://github.com/DXOMARK-Research/PIQ2023

要約(オリジナル)

Year after year, the demand for ever-better smartphone photos continues to grow, in particular in the domain of portrait photography. Manufacturers thus use perceptual quality criteria throughout the development of smartphone cameras. This costly procedure can be partially replaced by automated learning-based methods for image quality assessment (IQA). Due to its subjective nature, it is necessary to estimate and guarantee the consistency of the IQA process, a characteristic lacking in the mean opinion scores (MOS) widely used for crowdsourcing IQA. In addition, existing blind IQA (BIQA) datasets pay little attention to the difficulty of cross-content assessment, which may degrade the quality of annotations. This paper introduces PIQ23, a portrait-specific IQA dataset of 5116 images of 50 predefined scenarios acquired by 100 smartphones, covering a high variety of brands, models, and use cases. The dataset includes individuals of various genders and ethnicities who have given explicit and informed consent for their photographs to be used in public research. It is annotated by pairwise comparisons (PWC) collected from over 30 image quality experts for three image attributes: face detail preservation, face target exposure, and overall image quality. An in-depth statistical analysis of these annotations allows us to evaluate their consistency over PIQ23. Finally, we show through an extensive comparison with existing baselines that semantic information (image context) can be used to improve IQA predictions. The dataset along with the proposed statistical analysis and BIQA algorithms are available: https://github.com/DXOMARK-Research/PIQ2023

arxiv情報

著者 Nicolas Chahine,Ana-Stefania Calarasanu,Davide Garcia-Civiero,Theo Cayla,Sira Ferradans,Jean Ponce
発行日 2023-04-12 11:30:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク