Data Efficient Visual Place Recognition Using Extremely JPEG-Compressed Images

要約

Visual Place Recognition (VPR) は、ロボット プラットフォームが搭載カメラからの視覚刺激を正しく解釈して、異なる視点、照明、および外観の変化にもかかわらず、以前に訪れた場所に現在位置しているかどうかを判断する機能です。
JPEG は広く使用されている画像圧縮規格であり、画像の鮮明さを犠牲にして画像のサイズを大幅に縮小できます。
複数のロボット プラットフォームが同時に展開されるアプリケーションでは、収集された視覚データを各ロボット間でリモートで送信する必要があります。
したがって、JPEG 圧縮を使用して、通信チャネルを介して送信されるデータ量を大幅に削減できます。VPR の限られた帯域幅での作業は困難な作業であることが証明されているからです。
ただし、現在の VPR 技術のパフォーマンスに対する JPEG 圧縮の影響は、これまで研究されていません。
このため、このホワイト ペーパーでは、VPR 関連のシナリオにおける JPEG 圧縮の詳細な研究を紹介します。
さまざまな量の圧縮が適用された、確立されたベンチマーク データセットに対して、確立された VPR テクニックを選択して使用します。
圧縮を導入することで、VPR のパフォーマンスが大幅に低下することを示しています。特に、より高い圧縮範囲で顕著です。
さらに、このホワイト ペーパーでは、CNN の微調整を JPEG 圧縮データの最適化方法として利用して、JPEG 圧縮の極端に圧縮された画像で検出された画像変換とより一貫して実行する方法を示します。

要約(オリジナル)

Visual Place Recognition (VPR) is the ability of a robotic platform to correctly interpret visual stimuli from its on-board cameras in order to determine whether it is currently located in a previously visited place, despite different viewpoint, illumination and appearance changes. JPEG is a widely used image compression standard that is capable of significantly reducing the size of an image at the cost of image clarity. For applications where several robotic platforms are simultaneously deployed, the visual data gathered must be transmitted remotely between each robot. Hence, JPEG compression can be employed to drastically reduce the amount of data transmitted over a communication channel, as working with limited bandwidth for VPR can be proven to be a challenging task. However, the effects of JPEG compression on the performance of current VPR techniques have not been previously studied. For this reason, this paper presents an in-depth study of JPEG compression in VPR related scenarios. We use a selection of well-established VPR techniques on well-established benchmark datasets with various amounts of compression applied. We show that by introducing compression, the VPR performance is drastically reduced, especially in the higher spectrum of compression. Moreover, this paper demonstrates how fine-tuning a CNN can be utilised as an optimisation method for JPEG compressed data to perform more consistently with the image transformations detected in extremely JPEG compressed images.

arxiv情報

著者 Mihnea-Alexandru Tomita,Bruno Ferrarini,Michael Milford,Klaus McDonald-Maier,Shoaib Ehsan
発行日 2023-03-01 13:13:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク