Training-Free Consistency Pipeline for Fashion Repose

要約

拡散モデルの最近の進歩により、実際のオブジェクトの画像を編集する可能性が大幅に広がりました。
ただし、オブジェクトのポーズや画像ベースの条件付けの変更など、非剛性のない変換を実行することは依然として困難です。
これらの編集中にオブジェクトのアイデンティティを維持することは困難であり、現在の方法は、一貫性が重要な産業用アプリケーションに必要な精度に及ばないことがよくあります。
さらに、微調整拡散モデルにはカスタムトレーニングデータが必要です。これには、実際のシナリオで常にアクセスできるとは限りません。
この作品では、ファッション業界向けに特別に設計された非剛性ポーズ編集のためのトレーニングなしのパイプラインであるFashionReposeを紹介します。
このアプローチは、既製のモデルを統合して、長袖の衣服のポーズを調整し、アイデンティティとブランディングの属性を維持します。
FashionReposeは、ゼロショットアプローチを使用してこれらの編集をほぼリアルタイムで実行し、専門的なトレーニングの必要性を排除します。
一貫した画像編集。
このソリューションは、ファッション業界のアプリケーションや、画像編集でのアイデンティティの保存を要求する他の分野のアプリケーションの可能性を秘めています。

要約(オリジナル)

Recent advancements in diffusion models have significantly broadened the possibilities for editing images of real-world objects. However, performing non-rigid transformations, such as changing the pose of objects or image-based conditioning, remains challenging. Maintaining object identity during these edits is difficult, and current methods often fall short of the precision needed for industrial applications, where consistency is critical. Additionally, fine-tuning diffusion models requires custom training data, which is not always accessible in real-world scenarios. This work introduces FashionRepose, a training-free pipeline for non-rigid pose editing specifically designed for the fashion industry. The approach integrates off-the-shelf models to adjust poses of long-sleeve garments, maintaining identity and branding attributes. FashionRepose uses a zero-shot approach to perform these edits in near real-time, eliminating the need for specialized training. consistent image editing. The solution holds potential for applications in the fashion industry and other fields demanding identity preservation in image editing.

arxiv情報

著者 Potito Aghilar,Vito Walter Anelli,Michelantonio Trizio,Tommaso Di Noia
発行日 2025-01-23 14:17:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.SE パーマリンク