Multi-label Image Classification using Adaptive Graph Convolutional Networks: from a Single Domain to Multiple Domains

要約

この論文では、マルチラベル画像分類のための適応グラフベースのアプローチを提案します。
グラフベースの方法は、ラベル相関をモデル化できるため、マルチラベル分類の分野で広く利用されてきました。
具体的には、単一のドメインだけでなく、複数のドメインを考慮した場合でも有効性が証明されています。
ただし、使用されるグラフのトポロジはヒューリスティックに事前定義されているため、最適ではありません。
さらに、連続したグラフ畳み込みネットワーク (GCN) の集約は、機能の類似性を破壊する傾向があります。
これらの問題を克服するために、エンドツーエンドの方法でグラフの接続性を学習するためのアーキテクチャが導入されています。
これは、注意ベースのメカニズムと類似性保存戦略を統合することによって行われます。
次に、提案されたフレームワークは、敵対的トレーニング スキームを使用して複数のドメインに拡張されます。
よく知られている単一ドメインおよび複数ドメインのベンチマークに関する多数の実験が報告されています。
結果は、平均平均精度 (mAP) とモデル サイズの点で、私たちのアプローチが最先端技術よりも優れていることを示しています。

要約(オリジナル)

This paper proposes an adaptive graph-based approach for multi-label image classification. Graph-based methods have been largely exploited in the field of multi-label classification, given their ability to model label correlations. Specifically, their effectiveness has been proven not only when considering a single domain but also when taking into account multiple domains. However, the topology of the used graph is not optimal as it is pre-defined heuristically. In addition, consecutive Graph Convolutional Network (GCN) aggregations tend to destroy the feature similarity. To overcome these issues, an architecture for learning the graph connectivity in an end-to-end fashion is introduced. This is done by integrating an attention-based mechanism and a similarity-preserving strategy. The proposed framework is then extended to multiple domains using an adversarial training scheme. Numerous experiments are reported on well-known single-domain and multi-domain benchmarks. The results demonstrate that our approach outperforms the state-of-the-art in terms of mean Average Precision (mAP) and model size.

arxiv情報

著者 Indel Pal Singh,Enjie Ghorbel,Oyebade Oyedotun,Djamila Aouada
発行日 2023-01-11 14:42:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク