Introspective Deep Metric Learning for Image Retrieval


この論文では、不確実性を考慮した画像比較のための内省的ディープメトリクス学習 (IDML) フレームワークを提案します。
提案された IDML フレームワークは、不確実性モデリングを通じてディープメトリックラーニングのパフォーマンスを向上させ、画像検索とクラスタリングに広く使用されている CUB-200-2011、Cars196、および Stanford Online Products データセットで最先端の結果を達成します。
さらに、IDML の有効性と信頼性を実証するために、フレームワークの詳細な分析を提供します。
コードは から入手できます。


This paper proposes an introspective deep metric learning (IDML) framework for uncertainty-aware comparisons of images. Conventional deep metric learning methods produce confident semantic distances between images regardless of the uncertainty level. However, we argue that a good similarity model should consider the semantic discrepancies with caution to better deal with ambiguous images for more robust training. To achieve this, we propose to represent an image using not only a semantic embedding but also an accompanying uncertainty embedding, which describes the semantic characteristics and ambiguity of an image, respectively. We further propose an introspective similarity metric to make similarity judgments between images considering both their semantic differences and ambiguities. The proposed IDML framework improves the performance of deep metric learning through uncertainty modeling and attains state-of-the-art results on the widely used CUB-200-2011, Cars196, and Stanford Online Products datasets for image retrieval and clustering. We further provide an in-depth analysis of our framework to demonstrate the effectiveness and reliability of IDML. Code is available at:


著者 Wenzhao Zheng,Chengkun Wang,Jie Zhou,Jiwen Lu
発行日 2023-09-05 11:42:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク