Cross-platform Learning-based Fault Tolerant Surfacing Controller for Underwater Robots

要約

この論文では、補強学習(RL)に基づいて、水中ロボット用の新しいクロスプラットフォーム断層耐性サーフェシングコントローラーを提案します。
誤動作するアクチュエーターの明示的な識別を必要とする従来のアプローチとは異なり、我々の方法により、障害を特定する必要なく、残りの運用アクチュエーターのみを使用してロボットを表面化できます。
提案されたコントローラーは、さまざまなアクチュエータ構成で多様な障害シナリオを処理できる堅牢なポリシーを学習します。
さらに、さまざまなアクチュエーターを使用して、さまざまな水中ロボット全体で制御ポリシーの一部を共有する転送学習メカニズムを導入し、プラットフォーム全体で学習効率と一般化を改善します。
アプローチを検証するために、ホバリングタイプのAUV、魚雷型のAUV、およびタートル型のロボット(U-CAT)の3つの異なるタイプの水中ロボットでシミュレーションを実施します。
さらに、実世界の実験が実行され、制御された環境で学習ポリシーをシミュレーションから物理Uキャットに正常に転送します。
RLベースのコントローラーは、ベースラインコントローラーと比較して安定性と成功率の観点から優れたパフォーマンスを示し、ベースラインコントローラーの57.1%と比較して、実際のテストで85.7%の成功率を達成しています。
この研究は、現実世界の水生ミッションでの潜在的なアプリケーションを備えた、多様な水中プラットフォームのための断層耐性制御のためのスケーラブルで効率的なソリューションを提供します。

要約(オリジナル)

In this paper, we propose a novel cross-platform fault-tolerant surfacing controller for underwater robots, based on reinforcement learning (RL). Unlike conventional approaches, which require explicit identification of malfunctioning actuators, our method allows the robot to surface using only the remaining operational actuators without needing to pinpoint the failures. The proposed controller learns a robust policy capable of handling diverse failure scenarios across different actuator configurations. Moreover, we introduce a transfer learning mechanism that shares a part of the control policy across various underwater robots with different actuators, thus improving learning efficiency and generalization across platforms. To validate our approach, we conduct simulations on three different types of underwater robots: a hovering-type AUV, a torpedo shaped AUV, and a turtle-shaped robot (U-CAT). Additionally, real-world experiments are performed, successfully transferring the learned policy from simulation to a physical U-CAT in a controlled environment. Our RL-based controller demonstrates superior performance in terms of stability and success rate compared to a baseline controller, achieving an 85.7 percent success rate in real-world tests compared to 57.1 percent with a baseline controller. This research provides a scalable and efficient solution for fault-tolerant control for diverse underwater platforms, with potential applications in real-world aquatic missions.

arxiv情報

著者 Yuya Hamamatsu,Walid Remmas,Jaan Rebane,Maarja Kruusmaa,Asko Ristolainen
発行日 2025-02-10 23:50:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク