Fuzzy-Conditioned Diffusion and Diffusion Projection Attention Applied to Facial Image Correction

要約

画像拡散は最近、画像合成において、また暗黙的に画像事前処理として顕著なパフォーマンスを示しています。
このような事前分布は、修復問題を解決するためにコンディショニングとともに使用されてきましたが、バイナリのユーザーベースのコンディショニングのみをサポートしていました。
ファジー条件付き拡散を導出します。この拡散では、暗黙的な拡散事前分布を制御可能な強度で利用できます。
ファジー コンディショニングはピクセル単位で適用できるため、さまざまな画像コンポーネントをさまざまな程度に変更できます。
さらに、ファジー条件付き拡散と拡散由来のアテンション マップを組み合わせた顔画像補正への応用を提案します。
私たちのマップは異常の程度を推定し、拡散空間に投影することでそれを取得します。
私たちのアプローチがどのように解釈可能かつ自律的な顔画像補正にもつながるかを示します。

要約(オリジナル)

Image diffusion has recently shown remarkable performance in image synthesis and implicitly as an image prior. Such a prior has been used with conditioning to solve the inpainting problem, but only supporting binary user-based conditioning. We derive a fuzzy-conditioned diffusion, where implicit diffusion priors can be exploited with controllable strength. Our fuzzy conditioning can be applied pixel-wise, enabling the modification of different image components to varying degrees. Additionally, we propose an application to facial image correction, where we combine our fuzzy-conditioned diffusion with diffusion-derived attention maps. Our map estimates the degree of anomaly, and we obtain it by projecting on the diffusion space. We show how our approach also leads to interpretable and autonomous facial image correction.

arxiv情報

著者 Majed El Helou
発行日 2023-06-26 17:58:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク