Face Aging via Diffusion-based Editing

要約

この論文では、顔の老化の問題、すなわち、与えられた顔に加齢に伴う変化を組み込むことによって過去または将来の顔画像を生成するという問題に取り組みます。
以前のエイジング手法は人間の顔画像データセットのみに依存しているため、固有のスケールとバイアスによって制約を受けていました。
このため、その適用は生成可能な年齢範囲が限られており、大きな年齢ギャップに対処することができません。
私たちは、Difffusion ベースの編集を介して顔の老化に対処する新しいアプローチである FADING を提案します。
私たちは、大規模な言語イメージ拡散モデルの豊富な事前分布を活用することで、既存の手法を超えています。
まず、年齢を意識した微調整スキームを使用して、顔年齢編集のタスク用に事前トレーニングされた拡散モデルを特化します。
次に、入力画像を潜在ノイズに反転し、最適化されたヌル テキスト埋め込みを取得します。
最後に、注意制御を介してテキストガイドによるローカル年齢編集を実行します。
定量的および定性的分析は、私たちの方法が老化の精度、属性の保存、および老化の品質に関して既存のアプローチよりも優れていることを示しています。

要約(オリジナル)

In this paper, we address the problem of face aging: generating past or future facial images by incorporating age-related changes to the given face. Previous aging methods rely solely on human facial image datasets and are thus constrained by their inherent scale and bias. This restricts their application to a limited generatable age range and the inability to handle large age gaps. We propose FADING, a novel approach to address Face Aging via DIffusion-based editiNG. We go beyond existing methods by leveraging the rich prior of large-scale language-image diffusion models. First, we specialize a pre-trained diffusion model for the task of face age editing by using an age-aware fine-tuning scheme. Next, we invert the input image to latent noise and obtain optimized null text embeddings. Finally, we perform text-guided local age editing via attention control. The quantitative and qualitative analyses demonstrate that our method outperforms existing approaches with respect to aging accuracy, attribute preservation, and aging quality.

arxiv情報

著者 Xiangyi Chen,Stéphane Lathuilière
発行日 2023-09-20 13:47:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク