要約
画像の美的品質は、画像の美しさの尺度または評価として定義されます。
美学は本質的に主観的な特性ですが、画像の意味内容、芸術的側面を表す属性、ショットに使用される写真のセットアップなど、それに影響を与える特定の要因があります。この論文では、
セマンティックコンテンツ、芸術的なスタイル、および画像の構成の分析に基づく、画像の美学の自動予測。
提案されたネットワークには、次のものが含まれます。セマンティック特徴抽出用の事前トレーニング済みネットワーク(バックボーン)。
画像属性の予測にバックボーン機能に依存する多層パーセプトロン(MLP)ネットワーク(AttributeNet)。
AttributeNetによって生成された埋め込みに事前にエンコードされた属性を利用して、美的推定専用のターゲットネットワーク(AestheticNet)のパラメーターを予測する自己適応型ハイパーネットワーク。
画像が与えられると、提案されたマルチネットワークは、スタイルと構成の属性、および美的スコアの分布を予測することができます。
3つのベンチマークデータセットの結果は、提案された方法の有効性を示していますが、アブレーション研究は提案されたネットワークのより良い理解を提供します。
要約(オリジナル)
The aesthetic quality of an image is defined as the measure or appreciation of the beauty of an image. Aesthetics is inherently a subjective property but there are certain factors that influence it such as, the semantic content of the image, the attributes describing the artistic aspect, the photographic setup used for the shot, etc. In this paper we propose a method for the automatic prediction of the aesthetics of an image that is based on the analysis of the semantic content, the artistic style and the composition of the image. The proposed network includes: a pre-trained network for semantic features extraction (the Backbone); a Multi Layer Perceptron (MLP) network that relies on the Backbone features for the prediction of image attributes (the AttributeNet); a self-adaptive Hypernetwork that exploits the attributes prior encoded into the embedding generated by the AttributeNet to predict the parameters of the target network dedicated to aesthetic estimation (the AestheticNet). Given an image, the proposed multi-network is able to predict: style and composition attributes, and aesthetic score distribution. Results on three benchmark datasets demonstrate the effectiveness of the proposed method, while the ablation study gives a better understanding of the proposed network.
arxiv情報
著者 | Luigi Celona,Marco Leonardi,Paolo Napoletano,Alessandro Rozza |
発行日 | 2022-07-07 10:14:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google