Safe-VLN: Collision Avoidance for Vision-and-Language Navigation of Autonomous Robots Operating in Continuous Environments

要約

連続環境における視覚と言語によるナビゲーション (VLN-CE) のタスクは、視覚的観察と言語指示を使用して 3D 連続環境内をナビゲートするための低レベルのアクションを実行する自律エージェントをトレーニングすることを目的としています。
移動ロボットに対する VLN-CE の大きな可能性は、多数の研究で実証されています。
しかし、VLN-CE の既存の研究のほとんどは、標準的な離散視覚言語ナビゲーション (VLN) 手法を連続環境に移行することに主に焦点を当てており、衝突の問題を見落としています。
このような見落としにより、多くの場合、エージェントが計画された経路から逸脱したり、ひどい場合にはエージェントが障害物領域に閉じ込められてナビゲーション タスクに失敗したりする結果になります。
上記の問題に対処するために、この論文では、VLN-CE 内のさまざまな衝突シナリオを調査し、衝突の根本的な原因を推定するための分類方法を提案します。
さらに、Safe-VLN と呼ばれる新しい VLN-CE アルゴリズムは、ウェイポイント プレディクターとナビゲーターという 2 つの重要なコンポーネントを含む衝突回避機能を強化するために提案されています。
特に、ウェイポイント予測機能は、シミュレートされた 2D LiDAR 占有マスクを利用して、予測されたウェイポイントが障害物が多いエリアに位置することを防ぎます。
一方、ナビゲーターは、ロボット エージェントが永続的な衝突のサイクルに巻き込まれるのを防ぐために、「衝突後の再選択」という戦略を採用します。
提案された Safe-VLN は R2R-CE 上で評価され、その結果はナビゲーション パフォーマンスの向上と衝突発生率の統計的に有意な減少を示しています。

要約(オリジナル)

The task of vision-and-language navigation in continuous environments (VLN-CE) aims at training an autonomous agent to perform low-level actions to navigate through 3D continuous surroundings using visual observations and language instructions. The significant potential of VLN-CE for mobile robots has been demonstrated across a large number of studies. However, most existing works in VLN-CE focus primarily on transferring the standard discrete vision-and-language navigation (VLN) methods to continuous environments, overlooking the problem of collisions. Such oversight often results in the agent deviating from the planned path or, in severe instances, the agent being trapped in obstacle areas and failing the navigational task. To address the above-mentioned issues, this paper investigates various collision scenarios within VLN-CE and proposes a classification method to predicate the underlying causes of collisions. Furthermore, a new VLN-CE algorithm, named Safe-VLN, is proposed to bolster collision avoidance capabilities including two key components, i.e., a waypoint predictor and a navigator. In particular, the waypoint predictor leverages a simulated 2D LiDAR occupancy mask to prevent the predicted waypoints from being situated in obstacle-ridden areas. The navigator, on the other hand, employs the strategy of `re-selection after collision’ to prevent the robot agent from becoming ensnared in a cycle of perpetual collisions. The proposed Safe-VLN is evaluated on the R2R-CE, the results of which demonstrate an enhanced navigational performance and a statistically significant reduction in collision incidences.

arxiv情報

著者 Lu Yue,Dongliang Zhou,Liang Xie,Feitian Zhang,Ye Yan,Erwei Yin
発行日 2024-04-12 02:46:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク