要約
タイトル:StyleGANによるフェイスジェネレーションおよび編集:サーベイ
要約:このサーベイでは、フェイスジェネレーションおよび編集のための最先端の深層学習技術の概要を提供することを目的としています。最新の人気のあるアーキテクチャに焦点を当て、反転、潜在表現、損失関数、トレーニング手順、編集手法、クロスドメインスタイルトランスファーなど、これらが機能するキーのアイデアについて説明します。特に、高品質な顔画像の生成と、操作可能な意味解釈編集および写真品質の保持の豊富なインターフェイスを提供するStyleGANアプローチで集約されたGANベースのアーキテクチャに焦点を当てます。深層学習の基本的な知識を持っており、アクセスしやすい紹介と概要を探している読者のためのフィールドへの入り口を提供することを目的としています。
– サーベイの目的は、フェイスジェネレーションおよび編集の最新のAI技術を概観することです。
– 最新の人気のあるアーキテクチャに焦点を当て、機能するキーのアイデアについても説明します。
– StyleGANアプローチを中心に、GANベースのアーキテクチャに焦点を当て、高品質の顔画像を生成し、操作可能な意味の編集に対応する豊富なインターフェースを提供します。
– 深層学習の基本的な知識を持っている読者にとって、アクセスしやすい紹介と概要が提供されます。
要約(オリジナル)
Our goal with this survey is to provide an overview of the state of the art deep learning technologies for face generation and editing. We will cover popular latest architectures and discuss key ideas that make them work, such as inversion, latent representation, loss functions, training procedures, editing methods, and cross domain style transfer. We particularly focus on GAN-based architectures that have culminated in the StyleGAN approaches, which allow generation of high-quality face images and offer rich interfaces for controllable semantics editing and preserving photo quality. We aim to provide an entry point into the field for readers that have basic knowledge about the field of deep learning and are looking for an accessible introduction and overview.
arxiv情報
著者 | Andrew Melnik,Maksim Miasayedzenkau,Dzianis Makarovets,Dzianis Pirshtuk,Eren Akbulut,Dennis Holzmann,Tarek Renusch,Gustav Reichert,Helge Ritter |
発行日 | 2023-04-13 11:03:47+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI