Aesthetic Language Guidance Generation of Images Using Attribute Comparison

要約

モバイル写真技術の活発な発展に伴い、主要な携帯電話メーカーは、機器の撮影能力やソフトウェアの写真美化アルゴリズムの改善にしのぎを削っている。しかし、インテリジェントな機器やアルゴリズムの改良は、人間の主観的な撮影技術を置き換えることはできません。本論文では、画像の美的言語誘導(ALG)を提案します。ALGは、撮影テンプレートに基づくガイダンスルールか、ガイダンス画像に基づくガイダンスルールかによって、ALG-TとALG-Iに分類される。ALG-Tにせよ、ALG-Iにせよ、画像の色、照明、構図の3つの属性から撮影をガイドする。入力画像と撮影テンプレートやガイダンス画像との3つの属性の違いを自然言語で記述するのが、ALG(Aesthetic Natural Language Guidance)である。また、風景画像と人物画像では照明や構図が異なるため、入力画像を風景画像と人物画像に分割している。ALG-T、ALG-Iともに、2種類の入力画像(風景画像と人物画像)に対して、それぞれ美的言語誘導を行う。

要約(オリジナル)

With the vigorous development of mobile photography technology, major mobile phone manufacturers are scrambling to improve the shooting ability of equipments and the photo beautification algorithm of software. However, the improvement of intelligent equipments and algorithms cannot replace human subjective photography technology. In this paper, we propose the aesthetic language guidance of image (ALG). We divide ALG into ALG-T and ALG-I according to whether the guiding rules are based on photography templates or guidance images. Whether it is ALG-T or ALG-I, we guide photography from three attributes of color, lighting and composition of the images. The differences of the three attributes between the input images and the photography templates or the guidance images are described in natural language, which is aesthetic natural language guidance (ALG). Also, because of the differences in lighting and composition between landscape images and portrait images, we divide the input images into landscape images and portrait images. Both ALG-T and ALG-I conduct aesthetic language guidance respectively for the two types of input images (landscape images and portrait images).

arxiv情報

著者 Xin Jin,Qiang Deng,Jianwen Lv,Heng Huang,Hao Lou,Chaoen Xiao
発行日 2022-08-09 12:35:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク