Multi-Label Logo Recognition and Retrieval based on Weighted Fusion of Neural Features

要約

ロゴ画像の分類は、既知のオブジェクトから抽象的な形状まで、あらゆるものを表すことができるテキストや形状などの要素を含むため、困難な作業です。
ロゴ分類の現在の最先端技術では、単一の特徴に焦点を当てたマルチクラス タスクとして問題に対処していますが、ロゴには異なる色などの複数のラベルが同時に存在する可能性があります。
この作業では、視覚的に類似したロゴを、形状、色、商業セクター、セマンティクス、一般的な特徴、またはユーザーが選択した機能の組み合わせに従って、一連のデータから分類および検索できるようにする方法を提案します。
以前のアプローチとは異なり、この提案では、特定の属性に特化した一連のマルチラベル ディープ ニューラル ネットワークを採用し、取得した特徴を組み合わせて類似検索を実行します。
分類システムを詳しく調べるために、さまざまな既存のロゴ トポロジを比較し、商標登録データベースに通常含まれる不完全なラベルなど、いくつかの問題を分析します。
提案は、ウィーン オントロジーを使用して階層的に編成された欧州連合商標データセットからの 76,000 のロゴ (以前のアプローチの 7 倍) を考慮して評価されます。
全体として、実験は信頼できる定量的および定性的な結果を達成し、商標画像検索タスクの最新技術の正規化された平均ランク誤差を 0.040 から 0.018 に減らします。
最後に、ロゴのセマンティクスは主観的であることが多いため、グラフィック デザインの学生と専門家を対象に調査を行いました。
結果は、提案された方法論が人間の専門家オペレーターよりも優れたラベリングを提供し、ラベルランキングの平均精度を 0.53 から 0.68 に改善することを示しています。

要約(オリジナル)

Classifying logo images is a challenging task as they contain elements such as text or shapes that can represent anything from known objects to abstract shapes. While the current state of the art for logo classification addresses the problem as a multi-class task focusing on a single characteristic, logos can have several simultaneous labels, such as different colors. This work proposes a method that allows visually similar logos to be classified and searched from a set of data according to their shape, color, commercial sector, semantics, general characteristics, or a combination of features selected by the user. Unlike previous approaches, the proposal employs a series of multi-label deep neural networks specialized in specific attributes and combines the obtained features to perform the similarity search. To delve into the classification system, different existing logo topologies are compared and some of their problems are analyzed, such as the incomplete labeling that trademark registration databases usually contain. The proposal is evaluated considering 76,000 logos (7 times more than previous approaches) from the European Union Trademarks dataset, which is organized hierarchically using the Vienna ontology. Overall, experimentation attains reliable quantitative and qualitative results, reducing the normalized average rank error of the state-of-the-art from 0.040 to 0.018 for the Trademark Image Retrieval task. Finally, given that the semantics of logos can often be subjective, graphic design students and professionals were surveyed. Results show that the proposed methodology provides better labeling than a human expert operator, improving the label ranking average precision from 0.53 to 0.68.

arxiv情報

著者 Marisa Bernabeu,Antonio Javier Gallego,Antonio Pertusa
発行日 2022-12-09 11:55:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク