要約
コンテンツベースの画像検索 (CBIR) の研究のほとんどは、クエリに視覚的に類似した画像のデータベースからインスタンスを効果的に取得できる堅牢な特徴表現の開発に焦点を当てています。
ただし、取得された画像には、意味的にクエリに関連しない結果が含まれる場合があります。
これに対処するために、視覚的階層を使用して視覚的および意味的類似性の両方を捕捉する CBIR の方法を提案します。
階層は、重複するクラスが高い視覚的および意味論的な類似性を共有すると仮定して、分類用にトレーニングされたディープ ニューラル ネットワークの潜在空間内の重複する特徴を持つクラスをマージすることによって構築されます。
最後に、構築された階層は、類似性検索のための距離計算メトリックに統合されます。
標準データセット: CUB-200-2011 および CIFAR100 での実験、および珪藻顕微鏡画像を使用した実際の使用例は、画像検索において、私たちの方法が既存の方法と比較して優れたパフォーマンスを達成することを示しています。
要約(オリジナル)
Most of the research in content-based image retrieval (CBIR) focus on developing robust feature representations that can effectively retrieve instances from a database of images that are visually similar to a query. However, the retrieved images sometimes contain results that are not semantically related to the query. To address this, we propose a method for CBIR that captures both visual and semantic similarity using a visual hierarchy. The hierarchy is constructed by merging classes with overlapping features in the latent space of a deep neural network trained for classification, assuming that overlapping classes share high visual and semantic similarities. Finally, the constructed hierarchy is integrated into the distance calculation metric for similarity search. Experiments on standard datasets: CUB-200-2011 and CIFAR100, and a real-life use case using diatom microscopy images show that our method achieves superior performance compared to the existing methods on image retrieval.
arxiv情報
著者 | Aishwarya Venkataramanan,Martin Laviale,Cédric Pradalier |
発行日 | 2023-08-16 15:23:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google