要約
動的な障害物と静的な障害物、および高流量の河川などの強い流れの乱れを含む海洋環境での自律航行は、USV にとって大きな課題となります。
これらの課題に対処するために、我々は 2 種類の注意を活用する新しい方法論を提案します。 1 つは、多様な環境要因と感覚情報をナビゲーションの決定に統合する方法を学習する空間的注意、もう 1 つは動的で継続的に変化する性質を説明するための変圧器フレームワーク内での時間的注意です。
環境の。
私たちは、動的 ${\bf \text{Marine}}$ 環境向けの Trans${\bf \text{former}}$ ベースのナビゲーション ポリシーである MarineFormer を考案し、強化学習 (RL) を通じてエンドツーエンドでトレーニングしました。
MarineFormer の中核では、グラフ アテンションを使用して空間情報をキャプチャし、トランスフォーマー アーキテクチャを使用して、複数の静的および動的障害物が関与する 2D の乱流海洋条件をシミュレートする環境で時間シーケンスを処理します。
私たちは、提案された方法と最先端の方法、および他の古典的なプランナーのパフォーマンスを広範囲に評価します。
私たちのアプローチは、エピソード完了成功率で最先端のアプローチをほぼ $20\%$ 上回り、さらに USV のパス長効率を向上させます。
要約(オリジナル)
Navigating autonomously in marine environments including dynamic and static obstacles, and strong flow disturbances, such as in high-flow rivers, poses significant challenges for USVs. To address these challenges, we propose a novel methodology that leverages two types of attention: spatial attention, which learns to integrate diverse environmental factors and sensory information into navigation decisions, and temporal attention within a transformer framework to account for the dynamic, continuously changing nature of the environment. We devise MarineFormer, a Trans${\bf \text{former}}$-based navigation policy for dynamic ${\bf \text{Marine}}$ environments, trained end-to-end through reinforcement learning (RL). At its core, MarineFormer uses graph attention to capture spatial information and a transformer architecture to process temporal sequences in an environment that simulates a 2D turbulent marine condition involving multiple static and dynamic obstacles. We extensively evaluate the performance of the proposed method versus the state-of-the-art methods, as well as other classical planners. Our approach outperforms the state-of-the-art by nearly $20\%$ in episode completion success rate and additionally enhances the USV’s path length efficiency.
arxiv情報
著者 | Ehsan Kazemi,Iman Soltani |
発行日 | 2024-12-17 22:20:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google