要約
この論文では、既存のアプローチを超え、迅速なエンジニアリングや微調整を必要としない、画質と美観を評価するための新しいデータ駆動型のノンパラメトリック手法を紹介します。
データ内に効率的な画像アンカーを提案することで、表現力豊かなテキスト埋め込みの必要性を排除します。
7 つの最先端の自己教師ありモデルの広範な評価を通じて、私たちの手法はさまざまなデータセットとベンチマークにわたって優れたパフォーマンスと堅牢性を実証しています。
特に、限られたデータでも人間の評価と高い一致を達成し、データとその前処理パイプラインの性質に対する高い堅牢性を示しています。
私たちの貢献は、視覚情報の認識についての洞察を提供しながら、画像評価のための合理化されたソリューションを提供します。
要約(オリジナル)
This paper introduces a new data-driven, non-parametric method for image quality and aesthetics assessment, surpassing existing approaches and requiring no prompt engineering or fine-tuning. We eliminate the need for expressive textual embeddings by proposing efficient image anchors in the data. Through extensive evaluations of 7 state-of-the-art self-supervised models, our method demonstrates superior performance and robustness across various datasets and benchmarks. Notably, it achieves high agreement with human assessments even with limited data and shows high robustness to the nature of data and their pre-processing pipeline. Our contributions offer a streamlined solution for assessment of images while providing insights into the perception of visual information.
arxiv情報
著者 | Sergey Kastryulin,Denis Prokopenko,Artem Babenko,Dmitry V. Dylov |
発行日 | 2024-03-11 16:21:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google