MarineFormer: A Spatio-Temporal Attention Model for USV Navigation in Dynamic Marine Environments

要約

動的・静的な障害物や、高流量河川のような強い流れの擾乱を含む海洋環境において自律的に航行することは、USVにとって大きな課題となる。これらの課題に対処するために、我々は2つのタイプの注意を活用する新しい方法論を提案する。空間的注意は、多様な環境要因と感覚情報をナビゲーション決定に統合することを学習し、時間的注意は、環境の動的で連続的に変化する性質を考慮するために、変換器の枠組みの中で学習する。我々は、強化学習(RL)を通してエンド・ツー・エンドで学習された、動的な海洋環境のためのTrans{bf former}ベースのナビゲーション・ポリシーであるMarineFormerを考案する。その中核として、MarineFormerは、複数の静的・動的障害物を含む2D乱流海洋状態をシミュレートする環境において、空間情報を捕捉するためにグラフ注意を、時間シーケンスを処理するために変換器アーキテクチャを使用する。提案手法の性能を、最先端の手法や他の古典的なプランナーに対して広範囲に評価する。本手法は、エピソード完了成功率で最先端手法を20%近く上回り、さらにUSVの経路長効率を向上させる。

要約(オリジナル)

Navigating autonomously in marine environments including dynamic and static obstacles, and strong flow disturbances, such as in high-flow rivers, poses significant challenges for USVs. To address these challenges, we propose a novel methodology that leverages two types of attention: spatial attention, which learns to integrate diverse environmental factors and sensory information into navigation decisions, and temporal attention within a transformer framework to account for the dynamic, continuously changing nature of the environment. We devise MarineFormer, a Trans{\bf former}-based navigation policy for dynamic {\bf Marine} environments, trained end-to-end through reinforcement learning (RL). At its core, MarineFormer uses graph attention to capture spatial information and a transformer architecture to process temporal sequences in an environment that simulates a 2D turbulent marine condition involving multiple static and dynamic obstacles. We extensively evaluate the performance of the proposed method versus the state-of-the-art methods, as well as other classical planners. Our approach outperforms the state-of-the-art by nearly $20\%$ in episode completion success rate and additionally enhances the USV’s path length efficiency.

arxiv情報

著者 Ehsan Kazemi,Iman Soltani
発行日 2024-12-03 06:55:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.RO パーマリンク