Segment Augmentation and Differentiable Ranking for Logo Retrieval

要約

類似性の定義は画像検索タスクに比べて主観的であり、既知の類似性のセットは非常に少ないため、ロゴの検索は困難な問題です。
この課題に取り組むために、このホワイトペーパーでは、ロゴ検索用の深いネットワークをトレーニングするために人工的に類似したロゴを導入する、シンプルで効果的なセグメントベースの拡張戦略を提案します。
この新しい拡張戦略では、従来の画像レベルの拡張戦略とは異なり、最初にロゴ内のセグメントを見つけ、回転、スケーリング、色の変更などの変換をセグメントに適用します。
さらに、最近導入されたランキングベースの損失関数である Smooth-AP が、ロゴ検索の類似性を学習するためのより良いアプローチであるかどうかを評価します。
大規模な METU 商標データセットでは、(i) 当社のセグメントベースの増強戦略が、ベースライン モデルまたは画像レベルの増強戦略と比較して検索パフォーマンスを向上させ、(ii) Smooth-AP が実際にロゴの従来の損失よりも優れたパフォーマンスを発揮することを示しています。
検索。

要約(オリジナル)

Logo retrieval is a challenging problem since the definition of similarity is more subjective compared to image retrieval tasks and the set of known similarities is very scarce. To tackle this challenge, in this paper, we propose a simple but effective segment-based augmentation strategy to introduce artificially similar logos for training deep networks for logo retrieval. In this novel augmentation strategy, we first find segments in a logo and apply transformations such as rotation, scaling, and color change, on the segments, unlike the conventional image-level augmentation strategies. Moreover, we evaluate whether the recently introduced ranking-based loss function, Smooth-AP, is a better approach for learning similarity for logo retrieval. On the large scale METU Trademark Dataset, we show that (i) our segment-based augmentation strategy improves retrieval performance compared to the baseline model or image-level augmentation strategies, and (ii) Smooth-AP indeed performs better than conventional losses for logo retrieval.

arxiv情報

著者 Feyza Yavuz,Sinan Kalkan
発行日 2022-09-13 12:52:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク