Autoregressive GAN for Semantic Unconditional Head Motion Generation


タイトル:セマンティックな非条件付きヘッドモーション生成のためのAutoregressive GAN
– この論文では、1つのリファレンスポーズから、低次元のセマンティック空間から、静止している人間の顔をアニメーション化する非条件付きヘッドモーションの生成のタスクを扱う。
– 従来の音声に依存する話す頭の生成とは異なり、現実的な頭の動きに重点を置かないため、GANベースのアーキテクチャを考案し、低誤差蓄積レベルを維持しながら長時間にわたる豊富な頭の動きのシークエンスを合成する方法を学習する。
– 特に、増分出力の自己回帰的生成により、スムーズな軌跡を確保し、入力ペアのマルチスケールディスクリミネータは、高周波と低周波信号の扱いを向上させて、モードの崩壊を減らす。
– 提案された手法の関連性を実験的に示し、同様のタスクで最先端のパフォーマンスを達成したモデルと比較して、その優越性を示す。


In this work, we address the task of unconditional head motion generation to animate still human faces in a low-dimensional semantic space from a single reference pose. Different from traditional audio-conditioned talking head generation that seldom puts emphasis on realistic head motions, we devise a GAN-based architecture that learns to synthesize rich head motion sequences over long duration while maintaining low error accumulation levels.In particular, the autoregressive generation of incremental outputs ensures smooth trajectories, while a multi-scale discriminator on input pairs drives generation toward better handling of high- and low-frequency signals and less mode collapse.We experimentally demonstrate the relevance of the proposed method and show its superiority compared to models that attained state-of-the-art performances on similar tasks.


著者 Louis Airale,Xavier Alameda-Pineda,Stéphane Lathuilière,Dominique Vaufreydaz
発行日 2023-04-17 09:45:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CV パーマリンク