要約
画質データベースは、主観的な人間の認識を予測するためのモデルをトレーニングするために使用されます。
ただし、ほとんどの既存のデータベースは、自然条件ではなく、デジタルメディアで一般的に見られる歪みに焦点を当てています。
アフィン変換は、日常生活で人間の観察者が最も一般的に遭遇したものの1つであるため、勉強に特に関連しています。
このデータ記述子は、以前の既存の画像品質データベースと比較するための便利な参照として、控除株式アフィン画像変換(回転、翻訳、スケーリング)およびガウスノイズに対する一連の人間の応答を提示します。
応答は、確立された精神物理学:最尤差スケーリング法を使用して測定されました。
このセットには、864個の歪んだ画像に対する応答が含まれています。
実験には、105人のオブザーバーと20000件以上の画像の比較が含まれていました。
データセットの品質は、(a)古典的なpi \ ‘eronの法則を再現し、(b)古典的な絶対検出しきい値を再現し、(c)従来の画像品質データベースと一致しているが、グループマッド実験に従って改善するため、保証されます。
要約(オリジナル)
Image quality databases are used to train models for predicting subjective human perception. However, most existing databases focus on distortions commonly found in digital media and not in natural conditions. Affine transformations are particularly relevant to study, as they are among the most commonly encountered by human observers in everyday life. This Data Descriptor presents a set of human responses to suprathreshold affine image transforms (rotation, translation, scaling) and Gaussian noise as convenient reference to compare with previously existing image quality databases. The responses were measured using well established psychophysics: the Maximum Likelihood Difference Scaling method. The set contains responses to 864 distorted images. The experiments involved 105 observers and more than 20000 comparisons of quadruples of images. The quality of the dataset is ensured because (a) it reproduces the classical Pi\’eron’s law, (b) it reproduces classical absolute detection thresholds, and (c) it is consistent with conventional image quality databases but improves them according to Group-MAD experiments.
arxiv情報
著者 | Paula Daudén-Oliver,David Agost-Beltran,Emilio Sansano-Sansano,Valero Laparra,Jesús Malo,Marina Martínez-Garcia |
発行日 | 2025-03-12 15:12:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google