要約
ディープ ハッシュ技術は、効率的な画像検索のための主要なアプローチとして登場しました。
従来、これらの方法では、AlexNet や VGG-16 などの事前トレーニング済み畳み込みニューラル ネットワーク (CNN) を特徴抽出器として利用します。
しかし、データセットの複雑さの増大により、効果的な画像検索に不可欠な意味のある特徴を捕捉する際に、これらのバックボーン アーキテクチャに課題が生じています。
この研究では、最先端の技術を通じて学習した高解像度の特徴を画像検索タスクに採用することの有効性を調査します。
具体的には、高解像度ネットワーク (HRNet) をディープ ハッシュ タスクのバックボーンとして利用する、高解像度ハッシュ ネットワーク (HHNet) と呼ばれる新しい方法論を提案します。
私たちのアプローチは、CIFAR-10、NUS-WIDE、MS COCO、ImageNet など、テスト済みのすべてのベンチマーク データセットにわたって、既存の手法と比較して優れたパフォーマンスを示しています。
このパフォーマンスの向上は、複雑なデータセットの場合により顕著であり、複雑な画像検索タスクのために高解像度の機能を学習する必要性が強調されています。
さらに、さまざまな HRNet 構成の包括的な分析を実施し、ディープ ハッシュ タスクに最適なアーキテクチャについての洞察を提供します。
要約(オリジナル)
Deep hashing techniques have emerged as the predominant approach for efficient image retrieval. Traditionally, these methods utilize pre-trained convolutional neural networks (CNNs) such as AlexNet and VGG-16 as feature extractors. However, the increasing complexity of datasets poses challenges for these backbone architectures in capturing meaningful features essential for effective image retrieval. In this study, we explore the efficacy of employing high-resolution features learned through state-of-the-art techniques for image retrieval tasks. Specifically, we propose a novel methodology that utilizes High-Resolution Networks (HRNets) as the backbone for the deep hashing task, termed High-Resolution Hashing Network (HHNet). Our approach demonstrates superior performance compared to existing methods across all tested benchmark datasets, including CIFAR-10, NUS-WIDE, MS COCO, and ImageNet. This performance improvement is more pronounced for complex datasets, which highlights the need to learn high-resolution features for intricate image retrieval tasks. Furthermore, we conduct a comprehensive analysis of different HRNet configurations and provide insights into the optimal architecture for the deep hashing task
arxiv情報
著者 | Aymene Berriche,Mehdi Adjal Zakaria,Riyadh Baghdadi |
発行日 | 2024-03-20 16:54:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google