要約
タイトル:ファッション検出における不均衡ラベルサンプル分布のデータ効率的な訓練
要約:
– マルチラベル分類モデルは、視覚ベースのラベル予測や言語ベースの感情分類など、Eコマースにおいてさまざまな応用があります。
– これらのタスクで実際に十分な性能を実現するための主な課題は、データ分布の顕著な不均衡です。
– 例えば、ファッション属性検出では、大半のEコマースファッションカタログの中で1000製品のうち「パフスリーブ」の衣服が6つしかないことがあります。
– この問題に対処するために、十分なサンプルを収集するために膨大な注釈を取得することは経済的でも拡張性がないため、よりデータ効率的なモデルトレーニング技術を探求しています。
– この論文では、長い尾状のデータ分布を持つマルチラベル分類の深層ニューラルネットワーク(DNN)の性能を向上させるために最先端の重み付け目的関数を提案します。
– 実験は、ファッションアパレルの画像ベースの属性分類に関するものであり、その結果、新しい重み付け方法は非重み付けや逆周波数ベースの重み付け機構に比べて有利な性能を示しました。
– さらに、本研究では、現代のファッション産業における2つの人気のあるファッション属性タイプである袖型とアーチタイプの新しい重み付け機構の頑健性を評価しました。
要約(オリジナル)
Multi-label classification models have a wide range of applications in E-commerce, including visual-based label predictions and language-based sentiment classifications. A major challenge in achieving satisfactory performance for these tasks in the real world is the notable imbalance in data distribution. For instance, in fashion attribute detection, there may be only six ‘puff sleeve’ clothes among 1000 products in most E-commerce fashion catalogs. To address this issue, we explore more data-efficient model training techniques rather than acquiring a huge amount of annotations to collect sufficient samples, which is neither economic nor scalable. In this paper, we propose a state-of-the-art weighted objective function to boost the performance of deep neural networks (DNNs) for multi-label classification with long-tailed data distribution. Our experiments involve image-based attribute classification of fashion apparels, and the results demonstrate favorable performance for the new weighting method compared to non-weighted and inverse-frequency-based weighting mechanisms. We further evaluate the robustness of the new weighting mechanism using two popular fashion attribute types in today’s fashion industry: sleevetype and archetype.
arxiv情報
著者 | Xin Shen,Praful Agrawal,Zhongwei Cheng |
発行日 | 2023-05-07 21:25:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI