Aggregating Multiple Bio-Inspired Image Region Classifiers For Effective And Lightweight Visual Place Recognition

要約

視覚的場所認識 (VPR) により、自律システムは画像情報を使用して環境内で自身の位置を特定できます。
畳み込みニューラル ネットワーク (CNN) バックボーンに基づいて構築された VPR 技術は、最先端の VPR パフォーマンスを支配しますが、高い計算要件があるため、ローエンド ハードウェアを備えたプラットフォームには適していません。
最近、DrosoNet と呼ばれる複数の生物由来の分類器に基づく軽量 VPR システムが提案され、絶対的な場所検索パフォーマンスを犠牲にして優れた計算効率を達成しました。
この研究では、低計算プロファイルを維持しながら、VPR パフォーマンスが大幅に向上した、RegionDrosoNet と呼ばれる新しいマルチ DrosoNet 位置特定システムを提案します。
私たちのアプローチは、元の画像の異なるスライスされたパーティション上で DrosoNet の異なるグループを特殊化し、外部モデルの差別化を高めることに依存しています。
さらに、すべての DrosoNet の出力を組み合わせて、各 DrosoNet からの複数の上位リファレンス候補を考慮した最終順位予測を行う新しい投票モジュールを導入します。
RegionDrosoNet は、外観の変化と視点の変化の両方を処理する場合に、他の軽量 VPR 技術よりも優れたパフォーマンスを発揮します。
さらに、一部のベンチマーク データセットでは、オンライン推論時間のほんの一部で、計算量の多い手法と競合します。

要約(オリジナル)

Visual place recognition (VPR) enables autonomous systems to localize themselves within an environment using image information. While VPR techniques built upon a Convolutional Neural Network (CNN) backbone dominate state-of-the-art VPR performance, their high computational requirements make them unsuitable for platforms equipped with low-end hardware. Recently, a lightweight VPR system based on multiple bio-inspired classifiers, dubbed DrosoNets, has been proposed, achieving great computational efficiency at the cost of reduced absolute place retrieval performance. In this work, we propose a novel multi-DrosoNet localization system, dubbed RegionDrosoNet, with significantly improved VPR performance, while preserving a low-computational profile. Our approach relies on specializing distinct groups of DrosoNets on differently sliced partitions of the original image, increasing extrinsic model differentiation. Furthermore, we introduce a novel voting module to combine the outputs of all DrosoNets into the final place prediction which considers multiple top refence candidates from each DrosoNet. RegionDrosoNet outperforms other lightweight VPR techniques when dealing with both appearance changes and viewpoint variations. Moreover, it competes with computationally expensive methods on some benchmark datasets at a small fraction of their online inference time.

arxiv情報

著者 Bruno Arcanjo,Bruno Ferrarini,Maria Fasli,Michael Milford,Klaus D. McDonald-Maier,Shoaib Ehsan
発行日 2023-12-20 12:57:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク