FashionCLIP: Connecting Language and Images for Product Representations

要約

オンラインショッピングの着実な普及は、ますます複雑化するMLやNLPモデルの開発と密接に関連している。ほとんどのユースケースは特殊な教師あり学習問題として扱われるが、我々は、より移ろいやすい商品表現から実務家が大きな恩恵を受けると主張する。本研究では、ファッション業界向けのCLIPライクなモデルであるFashionCLIPを学習するために、対照学習における最近の開発成果を基にしたものである。また、検索、分類、グラウンディングの機能を紹介し、我々のモデルとコードをコミュニティへ公開する。

要約(オリジナル)

The steady rise of online shopping goes hand in hand with the development of increasingly complex ML and NLP models. While most use cases are cast as specialized supervised learning problems, we argue that practitioners would greatly benefit from more transferable representations of products. In this work, we build on recent developments in contrastive learning to train FashionCLIP, a CLIP-like model for the fashion industry. We showcase its capabilities for retrieval, classification and grounding, and release our model and code to the community.

arxiv情報

著者 Patrick John Chia,Giuseppe Attanasio,Federico Bianchi,Silvia Terragni,Ana Rita Magalhães,Diogo Goncalves,Ciro Greco,Jacopo Tagliabue
発行日 2023-03-02 23:13:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL, cs.IR パーマリンク