RAID-Database: human Responses to Affine Image Distortions

要約

画質データベースは、人間の主観的な知覚を予測するためのモデルをトレーニングするために使用されます。
しかし、既存のデータベースのほとんどは、自然条件ではなくデジタル メディアで一般的に見られる歪みに焦点を当てています。
アフィン変換は、人間の観察者が日常生活で最も頻繁に遭遇する変換の 1 つであるため、特に研究に関連しています。
このデータ記述子は、以前の既存の画質データベースと比較するための便利な参照として、しきい値を超えるアフィン画像変換 (回転、平行移動、スケーリング) およびガウス ノイズに対する人間の反応のセットを示します。
反応は、十分に確立された心理物理学である最尤差スケーリング法を使用して測定されました。
このセットには、864 個の歪んだ画像に対する応答が含まれています。
実験には 105 人の観察者が参加し、4 枚の画像を 20,000 回以上比較しました。
データセットの品質は、(a) 古典的なパイロンの法則を再現し、(b) 古典的な絶対検出しきい値を再現し、(c) 従来の画質データベースと一致しているが、グループに従って改善されているため、保証されています。
MAD実験。

要約(オリジナル)

Image quality databases are used to train models for predicting subjective human perception. However, most existing databases focus on distortions commonly found in digital media and not in natural conditions. Affine transformations are particularly relevant to study, as they are among the most commonly encountered by human observers in everyday life. This Data Descriptor presents a set of human responses to suprathreshold affine image transforms (rotation, translation, scaling) and Gaussian noise as convenient reference to compare with previously existing image quality databases. The responses were measured using well established psychophysics: the Maximum Likelihood Difference Scaling method. The set contains responses to 864 distorted images. The experiments involved 105 observers and more than 20000 comparisons of quadruples of images. The quality of the dataset is ensured because (a) it reproduces the classical Pi\’eron’s law, (b) it reproduces classical absolute detection thresholds, and (c) it is consistent with conventional image quality databases but improves them according to Group-MAD experiments.

arxiv情報

著者 Paula Daudén-Oliver,David Agost-Beltran,Emilio Sansano-Sansano,Valero Laparra,Jesús Malo,Marina Martínez-Garcia
発行日 2024-12-13 15:34:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, q-bio.NC, q-bio.QM パーマリンク