IMAGGarment-1: Fine-Grained Garment Generation for Controllable Fashion Design

要約

このホワイトペーパーでは、シルエット、色、ロゴの配置を正確に制御できる高忠実度の衣服の合成を可能にする、細粒衣服(FGG)フレームワークであるImaggarment-1を紹介します。
単一条件の入力に限定された既存の方法とは異なり、Imaggarment-1は、パーソナライズされたファッションデザインおよびデジタルアパレルアプリケーションにおける多条件制御性の課題に対処します。
具体的には、Imaggarment-1は2段階のトレーニング戦略を採用して、グローバルな外観とローカルの詳細を個別にモデル化しながら、エンドツーエンドの推論を通じて統一された制御可能な生成を可能にします。
最初の段階では、混合注意モジュールとカラーアダプターを使用して、シルエットと色を共同でコードするグローバルな外観モデルを提案します。
第2段階では、ユーザー定義のロゴと空間的制約を注入するための適応的な外観認識モジュールを備えたローカルエンハンスメントモデルを提示し、正確な配置と視覚的な一貫性を可能にします。
このタスクをサポートするために、スケッチ、カラー参照、ロゴの配置、テキストプロンプトなどのマルチレベルの設計条件と組み合わせた180Kを超える衣服サンプルを含む大規模なデータセットであるGarmentBenchをリリースします。
広範な実験は、我々の方法が既存のベースラインよりも優れていることを示しており、優れた構造安定性、色の忠実度、ローカル制御性のパフォーマンスを達成しています。
コードとモデルは、https://github.com/muzishen/imaggarment-1で入手できます。

要約(オリジナル)

This paper presents IMAGGarment-1, a fine-grained garment generation (FGG) framework that enables high-fidelity garment synthesis with precise control over silhouette, color, and logo placement. Unlike existing methods that are limited to single-condition inputs, IMAGGarment-1 addresses the challenges of multi-conditional controllability in personalized fashion design and digital apparel applications. Specifically, IMAGGarment-1 employs a two-stage training strategy to separately model global appearance and local details, while enabling unified and controllable generation through end-to-end inference. In the first stage, we propose a global appearance model that jointly encodes silhouette and color using a mixed attention module and a color adapter. In the second stage, we present a local enhancement model with an adaptive appearance-aware module to inject user-defined logos and spatial constraints, enabling accurate placement and visual consistency. To support this task, we release GarmentBench, a large-scale dataset comprising over 180K garment samples paired with multi-level design conditions, including sketches, color references, logo placements, and textual prompts. Extensive experiments demonstrate that our method outperforms existing baselines, achieving superior structural stability, color fidelity, and local controllability performance. The code and model are available at https://github.com/muzishen/IMAGGarment-1.

arxiv情報

著者 Fei Shen,Jian Yu,Cong Wang,Xin Jiang,Xiaoyu Du,Jinhui Tang
発行日 2025-04-17 17:59:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク