Data Efficient Training with Imbalanced Label Sample Distribution for Fashion Detection



– 多ラベル分類モデルは、視覚ベースのラベル予測や言語ベースの感情分類など、Eコマースにおいて幅広い用途がある。
– このようなタスクで、現実世界で満足のいくパフォーマンスを実現するための主要な課題の1つは、データ分布の顕著な不均衡である。
– たとえば、ファッション属性の検出では、Eコマースのファッションカタログのほとんどにおいて、6つの’puff sleeve’衣服しかない場合がある。
– この問題に対処するために、十分なサンプルを収集するために膨大な注釈を取得することは経済的でもスケーラブルでもないため、よりデータ効率的なモデルトレーニング技術を探求する。
– 本論文では、深層ニューラルネットワーク(DNN)のパフォーマンスを向上させるための最新の重み付き目的関数を提案する。
– このパフォーマンスは、長尾分布を持つ多ラベル分類の画像ベースの属性分類を対象とし、新しい重み付け方法と非重み付け方法、逆頻度ベースの重み付け機構を比較することで実験された。
– 結果は、新しい重み付けメカニズムが非重み付けや逆頻度ベースの重み付けメカニズムに比べて良好なパフォーマンスを示すことを示している。
– さらに、今日のファッション産業で人気のある2つのファッション属性タイプであるsleevetypeとarchetypeを使用して、新しい重み付けメカニズムの強健性を評価する。


Multi-label classification models have a wide range of applications in E-commerce, including visual-based label predictions and language-based sentiment classifications. A major challenge in achieving satisfactory performance for these tasks in the real world is the notable imbalance in data distribution. For instance, in fashion attribute detection, there may be only six ‘puff sleeve’ clothes among 1000 products in most E-commerce fashion catalogs. To address this issue, we explore more data-efficient model training techniques rather than acquiring a huge amount of annotations to collect sufficient samples, which is neither economic nor scalable. In this paper, we propose a state-of-the-art weighted objective function to boost the performance of deep neural networks (DNNs) for multi-label classification with long-tailed data distribution. Our experiments involve image-based attribute classification of fashion apparels, and the results demonstrate favorable performance for the new weighting method compared to non-weighted and inverse-frequency-based weighting mechanisms. We further evaluate the robustness of the new weighting mechanism using two popular fashion attribute types in today’s fashion industry: sleevetype and archetype.


著者 Xin Shen,Praful Agrawal,Zhongwei Cheng
発行日 2023-05-09 07:54:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.AI, cs.CV パーマリンク