An Efficient Detection and Control System for Underwater Docking using Machine Learning and Realistic Simulation: A Comprehensive Approach

要約

海中ドッキングは、自律型海中ロボット(AUV)の持続的な運用を可能にするために極めて重要である。そのためには、AUVがドッキングステーションを検出し、位置を特定できなければなりませんが、非常に動的な海中環境のため、これは複雑です。画像ベースのソリューションは、この環境に適応するための高い取得率と汎用性のある代替手段を提供しますが、水中環境は、低視認性、高濁度、歪みなどの課題を提示します。これに加えて、水中ドッキング能力を検証するためのフィールド実験は、実験の実施に必要な特殊な機器や安全への配慮のために、コストと危険が伴う可能性がある。この研究では、水中ドッキングの検出と分類を実行するために、さまざまなディープラーニングアーキテクチャを比較する。そして、最も優れた性能を持つアーキテクチャを、教師-生徒のパラダイムの下で知識蒸留を用いて圧縮し、ネットワークのメモリフットプリントを削減することで、リアルタイムの実装を可能にする。シミュレーションと現実のギャップを減らすために、生成的逆数ネットワーク(GAN)を使用して画像間の変換を行い、Gazeboシミュレーション画像を現実的な水中画像に変換する。得られた画像は、水中画像形成モデルを用いて処理され、様々な種類の水の下での距離による画像の減衰をシミュレートする。提案手法は最終的にAUVのドッキング成功率によって評価され、古典的なビジョン手法と比較される。シミュレーションの結果、水中の流れに関係なく、高濁度シナリオにおいて20%の改善が見られた。さらに、市販のAUV Iver3での実験結果を示すことで、提案手法の性能を示す。

要約(オリジナル)

Underwater docking is critical to enable the persistent operation of Autonomous Underwater Vehicles (AUVs). For this, the AUV must be capable of detecting and localizing the docking station, which is complex due to the highly dynamic undersea environment. Image-based solutions offer a high acquisition rate and versatile alternative to adapt to this environment; however, the underwater environment presents challenges such as low visibility, high turbidity, and distortion. In addition to this, field experiments to validate underwater docking capabilities can be costly and dangerous due to the specialized equipment and safety considerations required to conduct the experiments. This work compares different deep-learning architectures to perform underwater docking detection and classification. The architecture with the best performance is then compressed using knowledge distillation under the teacher-student paradigm to reduce the network’s memory footprint, allowing real-time implementation. To reduce the simulation-to-reality gap, a Generative Adversarial Network (GAN) is used to do image-to-image translation, converting the Gazebo simulation image into a realistic underwater-looking image. The obtained image is then processed using an underwater image formation model to simulate image attenuation over distance under different water types. The proposed method is finally evaluated according to the AUV docking success rate and compared with classical vision methods. The simulation results show an improvement of 20% in the high turbidity scenarios regardless of the underwater currents. Furthermore, we show the performance of the proposed approach by showing experimental results on the off-the-shelf AUV Iver3.

arxiv情報

著者 Jalil Chavez-Galaviz,Jianwen Li,Matthew Bergman,Miras Mengdibayev
発行日 2023-11-02 18:10:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO パーマリンク