Improving Generalization of Synthetically Trained Sonar Image Descriptors for Underwater Place Recognition

要約

水中環境での自律航行には、光の吸収や水の濁りなどの要因により課題が生じ、光学センサーの有効性が制限されます。
ソナー システムは、これらの制限の影響を受けないため、水中作業の認識に一般的に使用されます。
従来のコンピューター ビジョン アルゴリズムは、ソナーで生成された音響画像に適用すると効果が低くなります。一方、畳み込みニューラル ネットワーク (CNN) は通常、大量のラベル付きトレーニング データを必要としますが、これらのデータは利用できないか取得が困難であることがよくあります。
この目的を達成するために、合成データのみでトレーニングされながら実際のシナリオに一般化できる、新しいコンパクトなディープ ソナー記述子パイプラインを提案します。
私たちのアーキテクチャは、ResNet18 バックエンドと適切にパラメーター化されたランダム ガウス投影レイヤーに基づいており、入力ソナー データは標準のアドホック正規化/プレフィルター技術で強化されています。
カスタマイズされた合成データ生成手順も示されています。
提案された方法は、合成データと公的に入手可能な実際のデータの両方を使用して広範に評価され、最先端の方法と比較してその有効性が実証されています。

要約(オリジナル)

Autonomous navigation in underwater environments presents challenges due to factors such as light absorption and water turbidity, limiting the effectiveness of optical sensors. Sonar systems are commonly used for perception in underwater operations as they are unaffected by these limitations. Traditional computer vision algorithms are less effective when applied to sonar-generated acoustic images, while convolutional neural networks (CNNs) typically require large amounts of labeled training data that are often unavailable or difficult to acquire. To this end, we propose a novel compact deep sonar descriptor pipeline that can generalize to real scenarios while being trained exclusively on synthetic data. Our architecture is based on a ResNet18 back-end and a properly parameterized random Gaussian projection layer, whereas input sonar data is enhanced with standard ad-hoc normalization/prefiltering techniques. A customized synthetic data generation procedure is also presented. The proposed method has been evaluated extensively using both synthetic and publicly available real data, demonstrating its effectiveness compared to state-of-the-art methods.

arxiv情報

著者 Ivano Donadi,Emilio Olivastri,Daniel Fusaro,Wanmeng Li,Daniele Evangelista,Alberto Pretto
発行日 2023-09-24 17:22:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク