Face Attribute Editing with Disentangled Latent Vectors

要約

もつれを解かれた解釈可能な潜在的な方向を使用して、顔の属性を編集するための画像から画像への変換フレームワークを提案します。
顔の属性編集タスクは、編集中に他の属性を保持するために、属性の表現で制御可能な強度ともつれを解くことで、ターゲットを絞った属性編集の課題に直面しています。
この目標のために、固定された事前トレーニング済み GAN の潜在空間分解作業に着想を得て、潜在空間分解による属性編集を設計し、各属性について、他の属性と直交する線形方向を学習します。
これらの方向を、直交性の制約ともつれの解消の損失でトレーニングします。
画像を意味的に整理された潜在空間に投影するために、注意ベースのスキップ接続を使用してエンコーダー/デコーダー アーキテクチャを設定します。
以前の画像変換アルゴリズムと事前にトレーニングされた GAN による編集を広範囲に比較します。
私たちの広範な実験は、私たちの方法が最先端技術よりも大幅に改善されていることを示しています。
プロジェクトページ:https://yusufdalva.github.io/vecgan

要約(オリジナル)

We propose an image-to-image translation framework for facial attribute editing with disentangled interpretable latent directions. Facial attribute editing task faces the challenges of targeted attribute editing with controllable strength and disentanglement in the representations of attributes to preserve the other attributes during edits. For this goal, inspired by the latent space factorization works of fixed pretrained GANs, we design the attribute editing by latent space factorization, and for each attribute, we learn a linear direction that is orthogonal to the others. We train these directions with orthogonality constraints and disentanglement losses. To project images to semantically organized latent spaces, we set an encoder-decoder architecture with attention-based skip connections. We extensively compare with previous image translation algorithms and editing with pretrained GAN works. Our extensive experiments show that our method significantly improves over the state-of-the-arts. Project page: https://yusufdalva.github.io/vecgan

arxiv情報

著者 Yusuf Dalva,Hamza Pehlivan,Cansu Moran,Öykü Irmak Hatipoğlu,Ayşegül Dündar
発行日 2023-01-11 18:32:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク