要約
テキスト駆動のファッション合成とデザインは、人工知能生成コンテンツ (AIGC) の非常に価値のある部分であり、従来のファッション業界に大きな革命をもたらす可能性があります。
テキスト駆動のファッション合成とデザインの研究を進めるために、私たちは、豊富な構造化テキスト (FIRST) 記述を備えた 100 万枚の高解像度ファッション画像で構成される新しいデータセットを導入します。
FIRST では、幅広い服装カテゴリがあり、各画像とペアになったテキストの説明が複数の階層レベルで編成されています。
FISRT 上でトレーニングされた一般的な生成モデルの実験では、FIRST の必要性が示されています。
私たちは、データセットに基づいてファッション デザインをより創造的で想像力豊かにする、よりインテリジェントなファッション合成およびデザイン システムをさらに開発するようコミュニティに呼びかけます。
データセットは間もなくリリースされる予定です。
要約(オリジナル)
Text-driven fashion synthesis and design is an extremely valuable part of artificial intelligence generative content(AIGC), which has the potential to propel a tremendous revolution in the traditional fashion industry. To advance the research on text-driven fashion synthesis and design, we introduce a new dataset comprising a million high-resolution fashion images with rich structured textual(FIRST) descriptions. In the FIRST, there is a wide range of attire categories and each image-paired textual description is organized at multiple hierarchical levels. Experiments on prevalent generative models trained over FISRT show the necessity of FIRST. We invite the community to further develop more intelligent fashion synthesis and design systems that make fashion design more creative and imaginative based on our dataset. The dataset will be released soon.
arxiv情報
著者 | Zhen Huang,Yihao Li,Dong Pei,Jiapeng Zhou,Xuliang Ning,Jianlin Han,Xiaoguang Han,Xuejun Chen |
発行日 | 2023-11-13 15:50:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google