要約
この論文では、実際のフォント画像からフォントの印象を推定するという困難なタスクに取り組みます。
このタスクには、フォントの印象に関するアノテーションを含むフォント データセットと畳み込みニューラル ネットワーク (CNN) フレームワークを使用します。
ただし、フォント印象の注釈の主観的な特性により、個々のフォントに付加された印象が欠落したりノイズが多くなったりすることがよくあります。
このようなデータセットでも安定した印象推定を実現するために、入力画像に類似した見本フォントの印象をアンサンブルする戦略に依存する手本ベースの印象推定アプローチを提案します。
さらに、スキャンされた単語画像を模倣する合成フォント画像を使用して CNN をトレーニングし、CNN が実際のフォント画像の印象を推定できるようにします。
提案手法の基本性能を定量的・定性的に評価する。
次に、本のジャンルと実際の本の表紙画像のフォント印象との相関分析を行います。
この分析は、印象推定方法でのみ可能であることに注意することが重要です。
分析の結果、両者の相関関係にはさまざまな傾向が見られ、ブックカバーのデザイナーはフォントが与える印象を考慮して慎重にフォントを選んでいるという仮説が裏付けられています。
要約(オリジナル)
This paper addresses the challenging task of estimating font impressions from real font images. We use a font dataset with annotation about font impressions and a convolutional neural network (CNN) framework for this task. However, impressions attached to individual fonts are often missing and noisy because of the subjective characteristic of font impression annotation. To realize stable impression estimation even with such a dataset, we propose an exemplar-based impression estimation approach, which relies on a strategy of ensembling impressions of exemplar fonts that are similar to the input image. In addition, we train CNN with synthetic font images that mimic scanned word images so that CNN estimates impressions of font images in the wild. We evaluate the basic performance of the proposed estimation method quantitatively and qualitatively. Then, we conduct a correlation analysis between book genres and font impressions on real book cover images; it is important to note that this analysis is only possible with our impression estimation method. The analysis reveals various trends in the correlation between them – this fact supports a hypothesis that book cover designers carefully choose a font for a book cover considering the impression given by the font.
arxiv情報
著者 | Kazuki Kitajima,Daichi Haraguchi,Seiichi Uchida |
発行日 | 2024-02-23 10:00:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google