Contrastive language and vision learning of general fashion concepts

要約

【タイトル】一般的なファッションの概念の対比言語およびビジョン学習

【要約】
– オンラインショッピングの急速な発展に伴って、より複雑なMLおよびNLPモデルの開発が進んでいる。
– 多くの場合、用途は特化した監視学習問題として表現されるが、より転移可能な製品表現をもたらすことができると主張する。
– 本研究では、対比学習の最近の発展に基づき、ファッション産業向けのCLIPのようなモデルであるFashionCLIPを構築する。
– 検索、分類、グラウンディングのためのFashionCLIPの能力を紹介し、モデルとコードをコミュニティにリリースする。

要約(オリジナル)

The steady rise of online shopping goes hand in hand with the development of increasingly complex ML and NLP models. While most use cases are cast as specialized supervised learning problems, we argue that practitioners would greatly benefit from more transferable representations of products. In this work, we build on recent developments in contrastive learning to train FashionCLIP, a CLIP-like model for the fashion industry. We showcase its capabilities for retrieval, classification and grounding, and release our model and code to the community.

arxiv情報

著者 Patrick John Chia,Giuseppe Attanasio,Federico Bianchi,Silvia Terragni,Ana Rita Magalhães,Diogo Goncalves,Ciro Greco,Jacopo Tagliabue
発行日 2023-04-18 23:32:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.IR パーマリンク