Multi-scale Attention Guided Pose Transfer

要約

ポーズ転送とは、異なるポーズをとっている人の別のイメージから、以前に見えなかった小説ポーズを持つ人の確率的イメージ生成を指します。
潜在的な学術および商業アプリケーションのため、この問題は近年広範囲に研究されています。
問題へのさまざまなアプローチの中で、注意ガイド付きプログレッシブ生成は、ほとんどの場合、最新の結果を生み出すことが示されています。
このペーパーでは、エンコーダとデコーダーのすべての解像度レベルで注意リンクを導入することにより、ポーズ転送のための改善されたネットワークアーキテクチャを紹介します。
このような密なマルチスケールの注意ガイドアプローチを利用することにより、視覚的および分析的に既存の方法よりも大幅な改善を達成することができます。
DeepFashionデータセット上のいくつかの既存のメソッドとの広範な定性的および定量的比較で、調査結果を締めくくります。

要約(オリジナル)

Pose transfer refers to the probabilistic image generation of a person with a previously unseen novel pose from another image of that person having a different pose. Due to potential academic and commercial applications, this problem is extensively studied in recent years. Among the various approaches to the problem, attention guided progressive generation is shown to produce state-of-the-art results in most cases. In this paper, we present an improved network architecture for pose transfer by introducing attention links at every resolution level of the encoder and decoder. By utilizing such dense multi-scale attention guided approach, we are able to achieve significant improvement over the existing methods both visually and analytically. We conclude our findings with extensive qualitative and quantitative comparisons against several existing methods on the DeepFashion dataset.

arxiv情報

著者 Prasun Roy,Saumik Bhattacharya,Subhankar Ghosh,Umapada Pal
発行日 2025-02-18 17:18:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.MM パーマリンク