Deep Reinforcement Learning for Localizability-Enhanced Navigation in Dynamic Human Environments

要約

自律型ロボットが効率的かつ安全に移動するには、信頼性の高い位置特定が不可欠です。
一部のナビゲーション方法は、高いローカリゼーション (信頼できるローカリゼーションを取得する能力を表す) でパスを計画できます。
これらのパスをたどることで、ロボットは、ローカリゼーション アルゴリズムによるより正確な位置推定結果を促進するセンサー ストリームにアクセスできます。
ただし、これらの方法のほとんどは事前の知識が必要であり、目に見えないシナリオや動的な変化に適応するのに苦労しています。
これらの制限を克服するために、動的な人間の環境での深層強化学習を介してローカライズを強化したナビゲーションのための新しいアプローチを提案します。
提案されたプランナーは、ローカリゼーションに役立つ 2D レーザー データから幾何学的特徴を自動的に抽出します。
プランナーは、幾何学的特徴にさまざまな重要性を割り当てることを学習し、ロボットがレーザー位置特定に役立つ領域をナビゲートするように促します。
プランナーの学習を促進するために、2 つの手法を提案します。(1) 動的な変化とローカリゼーション結果の信頼性を考慮した拡張状態表現。これにより、より多くの情報が提供され、ロボットがより適切な決定を下せるようになります。(2)
ローカリゼーションの精度に影響を与える行動について、疎と密の両方のフィードバックを提供できる報酬メトリック。
私たちの方法は、以前に見られなかった環境でテストされたときに、紛失率と到着率の大幅な改善を示しています。

要約(オリジナル)

Reliable localization is crucial for autonomous robots to navigate efficiently and safely. Some navigation methods can plan paths with high localizability (which describes the capability of acquiring reliable localization). By following these paths, the robot can access the sensor streams that facilitate more accurate location estimation results by the localization algorithms. However, most of these methods require prior knowledge and struggle to adapt to unseen scenarios or dynamic changes. To overcome these limitations, we propose a novel approach for localizability-enhanced navigation via deep reinforcement learning in dynamic human environments. Our proposed planner automatically extracts geometric features from 2D laser data that are helpful for localization. The planner learns to assign different importance to the geometric features and encourages the robot to navigate through areas that are helpful for laser localization. To facilitate the learning of the planner, we suggest two techniques: (1) an augmented state representation that considers the dynamic changes and the confidence of the localization results, which provides more information and allows the robot to make better decisions, (2) a reward metric that is capable to offer both sparse and dense feedback on behaviors that affect localization accuracy. Our method exhibits significant improvements in lost rate and arrival rate when tested in previously unseen environments.

arxiv情報

著者 Yuan Chen,Quecheng Qiu,Xiangyu Liu,Guangda Chen,Shunyi Yao,Jie Peng,Jianmin Ji,Yanyong Zhang
発行日 2023-03-22 07:44:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク