Leveraging High-Resolution Features for Improved Deep Hashing-based Image Retrieval


ディープ ハッシュ技術は、効率的な画像検索のための主要なアプローチとして登場しました。
従来、これらの方法では、AlexNet や VGG-16 などの事前トレーニング済み畳み込みニューラル ネットワーク (CNN) を特徴抽出器として利用します。
しかし、データセットの複雑さの増大により、効果的な画像検索に不可欠な意味のある特徴を捕捉する際に、これらのバックボーン アーキテクチャに課題が生じています。
具体的には、高解像度ネットワーク (HRNet) をディープ ハッシュ タスクのバックボーンとして利用する、高解像度ハッシュ ネットワーク (HHNet) と呼ばれる新しい方法論を提案します。
私たちのアプローチは、CIFAR-10、NUS-WIDE、MS COCO、ImageNet など、テスト済みのすべてのベンチマーク データセットにわたって、既存の手法と比較して優れたパフォーマンスを示しています。
さらに、さまざまな HRNet 構成の包括的な分析を実施し、ディープ ハッシュ タスクに最適なアーキテクチャについての洞察を提供します。


Deep hashing techniques have emerged as the predominant approach for efficient image retrieval. Traditionally, these methods utilize pre-trained convolutional neural networks (CNNs) such as AlexNet and VGG-16 as feature extractors. However, the increasing complexity of datasets poses challenges for these backbone architectures in capturing meaningful features essential for effective image retrieval. In this study, we explore the efficacy of employing high-resolution features learned through state-of-the-art techniques for image retrieval tasks. Specifically, we propose a novel methodology that utilizes High-Resolution Networks (HRNets) as the backbone for the deep hashing task, termed High-Resolution Hashing Network (HHNet). Our approach demonstrates superior performance compared to existing methods across all tested benchmark datasets, including CIFAR-10, NUS-WIDE, MS COCO, and ImageNet. This performance improvement is more pronounced for complex datasets, which highlights the need to learn high-resolution features for intricate image retrieval tasks. Furthermore, we conduct a comprehensive analysis of different HRNet configurations and provide insights into the optimal architecture for the deep hashing task


著者 Aymene Berriche,Mehdi Adjal Zakaria,Riyadh Baghdadi
発行日 2024-03-20 16:54:55+00:00
