要約
コンテンツとスタイルの分離は、少数ショットのフォント生成を実現する効果的な方法です。
これにより、ソース ドメインのフォント イメージのスタイルを、ターゲット ドメインのいくつかの参照イメージで定義されたスタイルに転送できます。
ただし、代表的なフォントを使用して抽出されたコンテンツの特徴は最適ではない可能性があります。
これを考慮して、我々は、ベースフォントのコンテンツ特徴によって定義される線形空間にコンテンツ特徴を投影するコンテンツ融合モジュール(CFM)を提案します。これは、異なるフォントによって引き起こされるコンテンツ特徴の変動を考慮することができます。
私たちの方法では、軽量の反復スタイル ベクトル洗練 (ISR) 戦略を通じて、参照画像のスタイル表現ベクトルを最適化することもできます。
さらに、文字画像の 1D 投影を確率分布として扱い、2 つの分布間の距離を再構成損失 (投影文字損失、PCL) として利用します。
L2 または L1 再構成損失と比較して、分散距離では文字の全体的な形状により注意が払われます。
それぞれ 6.5k 文字を持つ 300 フォントのデータセットでメソッドを評価しました。
実験結果は、私たちの方法が既存の最先端の少数ショットフォント生成方法よりも大幅に優れていることを証明しています。
ソース コードは https://github.com/wangchi95/CF-Font にあります。
要約(オリジナル)
Content and style disentanglement is an effective way to achieve few-shot font generation. It allows to transfer the style of the font image in a source domain to the style defined with a few reference images in a target domain. However, the content feature extracted using a representative font might not be optimal. In light of this, we propose a content fusion module (CFM) to project the content feature into a linear space defined by the content features of basis fonts, which can take the variation of content features caused by different fonts into consideration. Our method also allows to optimize the style representation vector of reference images through a lightweight iterative style-vector refinement (ISR) strategy. Moreover, we treat the 1D projection of a character image as a probability distribution and leverage the distance between two distributions as the reconstruction loss (namely projected character loss, PCL). Compared to L2 or L1 reconstruction loss, the distribution distance pays more attention to the global shape of characters. We have evaluated our method on a dataset of 300 fonts with 6.5k characters each. Experimental results verify that our method outperforms existing state-of-the-art few-shot font generation methods by a large margin. The source code can be found at https://github.com/wangchi95/CF-Font.
arxiv情報
著者 | Chi Wang,Min Zhou,Tiezheng Ge,Yuning Jiang,Hujun Bao,Weiwei Xu |
発行日 | 2024-04-15 08:22:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google